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Apresentação 


Até os anos 1960, auge da corrida espacial, a imensa maioria dos controladores era 
implementada na forma analógica. A simples conversão dos controladores analógicos para 
a forma de tempo discreto era a visão predominante no início do estudo dos sistemas de 
controle a dados amostrados. Entretanto, rapidamente se constatou que poderia haver 
muitos benefícios explorando-se todo o potencial da nova abordagem. 

O desenvolvimento notável da microeletrônica possibilitou a construção de disposi- 
tivos digitais de custo progressivamente baixo e cada vez mais potentes, tanto no que 
se refere à velocidade de processamento como à capacidade de armazenamento de da- 
dos. Isso tornou viável a utilização de sofisticados sistemas de controle digitais em uma 
vastíssima gama de aplicações. 

Atualmente, quase tudo o que nós utilizamos direta ou indiretamente tem um ou 
vários sistemas de controle embutidos. Isto é verdade tanto para dispositivos de uso 
corriqueiro no dia a dia — simples eletrodomésticos ou telefones celulares, por exemplo 
— como para equipamentos destinados a aplicações críticas — como robôs móveis para 
missões interplanetárias ou pilotos automáticos de aviões, por exemplo. 

Em muitos casos, esses controladores são responsáveis por assegurar o bom desempe- 
nho do equipamento ou dispositivo. Um exemplo disto são os diversos sistemas embarca- 
dos existentes atualmente nos automóveis. Por outro lado, há muitas situações em que os 
controladores são, de fato, imprescindíveis para a operação adequada dos equipamentos. 
Este é o caso, por exemplo, de sistemas de controle responsáveis pela guiagem de foguetes 
durante seu lançamento. 

É nesse importante contexto que se situa este livro, um texto bastante completo e 
abrangente sobre a análise de sistemas a tempo discreto e o projeto de controladores 
digitais. 

O livro caracteriza-se por uma visão prática, predominantemente voltada para o pro- 
jeto de sistemas de controle digitais. São características do texto a clareza da exposição, 
a linguagem acessível e os exemplos elaborados com forte motivação didática, incluindo 


os códigos em MATLAB®. Um detalhe que mostra o cuidado dos autores neste aspecto 
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é representado pelo fato de que os controladores não são implementados utilizando fun- 
ções fechadas do Simulink®, mas sim o bloco Matlab Function, em que as equações de 
diferenças dos controladores são programadas. 

A obra, cujos capítulos são sempre iniciados com uma breve descrição de seu con- 
teúdo, contém uma revisão de conceitos fundamentais e introduz os elementos básicos 
necessários para o desenvolvimento do assunto. Discute em detalhes a discretização de 
sistemas a tempo contínuo e apresenta ferramentas para a análise e o projeto de sistemas 
a tempo discreto. 

São tratados tanto sistemas de uma entrada e uma saída descritos por meio de 
funções de transferência discretas, como sistemas multivariáveis representados por meio 
de modelos de estados — neste contexto, incluem-se tópicos fundamentais como formas 
canônicas, controlabilidade, observabilidade, estabilidade, realimentação de estados, etc. 
O livro contém também uma introdução ao Controle Ótimo a tempo discreto, incluindo 
os célebres Regulador Linear Quadrático e Filtro de Kalman. 

Adicionalmente, aspectos práticos de implementação de controladores digitais, além 
de permearem todo o texto, merecem um capítulo especial em que são tratadas as ques- 
tões dos erros de quantização e de arredondamento. 

Como “brinde”, o livro contém ainda um apêndice sobre modelagem de sistemas me- 
cânicos, assunto tido como tabu para muitos engenheiros com formação em áreas não afins 
à mecânica. Além disso, também é objeto de um apêndice o uso do MATLAB/ Simulink® 
para a simulação de sistemas de controle digitais, o qual pode ser de grande utilidade 
prática. 

Todas essas características fazem deste livro uma obra que pode ser de grande utili- 
dade não apenas para estudantes de graduação e de pós-graduação, como também para 
profissionais envolvidos com a prática de projeto. 

Por último, mas não menos importante, há que se saudar a iniciativa dos autores 
de disponibilizarem seu conhecimento por meio de um livro de alta qualidade escrito em 
português, o qual nada fica a dever aos melhores textos estrangeiros sobre o assunto. 
Há obras herméticas que às vezes chegam a dar a impressão de terem sido escritas para 
demonstrar erudição; por outro lado, há outras que são produzidas nitidamente com a in- 


tenção de difundir o conhecimento. Seguramente este livro faz parte deste segundo grupo. 


José Jaime da Cruz 


Prof. da Escola Politécnica da USP 


Prefacio 


Este livro surgiu das notas de aula da disciplina PTC5611 - Controle Digital de 
Sistemas Dinâmicos, da Escola Politécnica da Universidade de São Paulo (EPUSP), mi- 
nistrada como um curso introdutório no Programa de Pós-graduação em Engenharia 
Elétrica da EPUSP. 

Controladores digitais estao presentes em uma grande quantidade de sistemas mo- 
dernos, tais como aplicações industriais, espaciais, automotivas e de uso pessoal, como 
smartphones. O estudo de controle digital vai muito além do currículo de cursos de En- 
genharia de Controle, uma vez que é muito importante também em áreas como Robótica, 
Eletrônica de Potência, Eletrônica Automotiva, Telecomunicações, entre outras. 

Os três capítulos iniciais são apresentados como revisão e fundamentação teórica 
básica para análise de sistemas em tempo discreto e projeto de controladores digitais. O 
Capítulo 1 apresenta uma introdução ao processamento digital de sinais. Uma revisão 
sobre a teoria de amostragem é apresentada no Capítulo 2, enquanto o Capítulo 3 revisa 
a transformada-z. 

O Capítulo 4 apresenta os fundamentos de discretização de sistemas contínuos, quer 
seja para discretizar controladores contínuos previamente projetados, ou para discretizar 
sistemas em que o projeto do controlador é feito em tempo discreto. 

O Capítulo 5 contém ferramentas de análise de sistemas em tempo discreto, tais como 
a relação entre a posição dos polos de um sistema no plano-z e sua resposta transitória, 
análise de erro em regime permanente, análise de estabilidade, lugar geométrico das raízes 
e resposta em frequência no plano-z. 

Os Capítulos 6 e 7 apresentam técnicas de projeto de controladores digitais clássicos 
e utilizando o método direto de Ragazzini, respectivamente. As simulações, feitas em 
ambiente MATLAB/ Simulink®, utilizam blocos do tipo Matlab Function para programar 
as equações de diferenças dos controladores ao invés de utilizar comandos e blocos prontos. 
Isso proporciona uma proximidade com a programação de controladores embarcados em 
hardwares digitais. Considerou-se a versão R2021a do MATLAB/Simulink®. 


O Capítulo 8 trata da análise em tempo discreto e do projeto de controle digital no 
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espaco de estados. Aspectos tedricos sobre controlabilidade, observabilidade e estabili- 
dade são abordados. Projeto de controladores em modo regulatório e em modo servo sao 
apresentados com exemplos de simulagao. 

O Capitulo 9 traz uma introdução ao controle ótimo, com foco no regulador linear 
quadrático e no filtro de Kalman. Os Capítulos 8 e 9 seguem a mesma metodologia de 
simulação dos Capítulos 6 e 7. 

O Capítulo 10 apresenta alguns problemas encontrados na aplicação de controladores 
digitais em relação a ruídos de quantização e arredondamento, e como tratá-los. Um 
pseudocódigo para implementação em hardware digital também é apresentado no final 
do capítulo. 

Há, adicionalmente, três apêndices ao texto: o Apêndice A faz uma breve revisão de 
controladores PID em tempo contínuo. Já o Apêndice B apresenta com detalhes a meto- 
dologia de simulação e, por fim, o Apêndice C traz uma breve introdução à modelagem 
matemática de sistemas mecánicos no MATLAB/Simulink®. 

Este texto aborda aspectos básicos de controle digital em nível de graduacáo, mas 
também pode ser utilizado em um curso introdutório e nivelador no ámbito da pós- 
graduação. Ao fazer uso de simulações em MATLAB®, em que os controladores digitais 
são programados diretamente em linhas de código, sem a utilização de blocos prontos, o 
texto desmistifica a ilusória distância entre um projeto teórico e uma aplicação prática. 
Desse modo, o livro é um guia indicado para quem deseja ser um “controleiro mão na 
massa”. 

Gostaríamos de prestar nosso agradecimento a todos os alunos, pesquisadores e pro- 
fessores que contribuíram para este material se tornar um livro. Agradecemos especi- 
almente ao Prof. Ricardo Paulino Marques, pelo exemplo de projeto e discretização de 
controladores, ao Prof. Anselmo Bittar, pelo exemplo que serviu de base para o projeto 
de controlador PID digital, ao pesquisador Vanderlei Aparecido da Silva, por exemplos 
sobre amostragem e transformada-z, e ao Prof. José Jaime da Cruz, por nos agraciar 
com o texto de apresentação desta obra. 

Agradecemos também aos professores e pesquisadores amigos que tiveram paciência 
para ler e revisar fragmentos do texto: Prof. José Jaime da Cruz, Prof. Felipe Pait, 
Prof. Diego Colón, Prof. Márcio Eisencraft, Prof. Paulo Sérgio Pereira da Silva, Prof. 
Fuad Kassab Junior, Prof. Ricardo Paulino Marques, Prof. Anselmo Bittar, Prof. Paulo 
Rogério Scalassara, Prof. Cristiano Agulhari, e o pesquisador Guilherme Scabin. 

Pela oportunidade de publicar este material, somos muito gratos à Sociedade Brasi- 
leira de Automática (SBA). Agradecemos também ao trabalho editorial profissional da 
Editora Blucher. 
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Somos também muito gratos a Deus e aos nossos familiares. Bruno: ao meu pai José 
Mariano, minha esposa Janaina, meus irmãos Paulo e Carlos, minha sogra Gláucia e 
minha madrinha (de consideração) Neusa. Gabriel: à minha mãe Cassia, meu pai Ivan, 
minha namorada Rayra, minhas irmãs Fernanda, Marina e Bianca e minha sobrinha 


Olívia. 


Bruno Augusto Angélico 
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Capitulo 1 


Introducao 


Até a década de 1960 a tecnologia de controle de processos e processamento de sinais 
era praticamente toda analógica. A evolução dos computadores digitais e microprocessa- 
dores, juntamente com o desenvolvimento de algoritmos eficientes, causaram a migração 
para o controle digital e o processamento digital de sinais. 

Diversas grandezas físicas com as quais lidamos são analógicas por natureza. Tais 
grandezas, como temperatura, pressão, velocidade etc., são representadas por valores 
contínuos. Sinais analógicos podem ser processados por circuitos elétricos envolvendo 
componentes passivos e ativos. 

Os sinais também podem ser processados utilizando-se hardwares digitais. Para 
isso, os sinais analógicos precisam ser convertidos em digitais. Isso é conhecido como 
conversão analógico-digital (A/D). Basicamente, esse processo toma um número finito 
de amostras temporais do sinal analógico (processo de discretização no tempo) e efetua 
uma quantização das amplitudes dessas amostras, para que elas sejam representadas com 
um número finito de bits (processo de digitalização). 

A princípio, quando comparado ao processamento analógico, o processamento digital 
de sinais tem uma estrutura mais complicada, levando ao seguinte questionamento: por 
que utilizá-lo? A resposta para tal pergunta possui vários argumentos favoráveis, tais 


como: 
e possibilidade de armazenagem dos sinais e posterior processamento; 


e as operações são basicamente adição, multiplicação e deslocamento, o que repre- 


senta um processamento bem robusto; 


e as operações podem ser facilmente modificadas, por exemplo, mudando apenas 
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algumas linhas de código da programação de um microcontrolador; 


e facilidade de interconexão de blocos, uma vez que não há problemas de casamento 


de impedância como nos circuitos analógicos. 


1.1 Classificação de sinais 


Sinais geralmente transportam informações a respeito do estado ou do comporta- 
mento de um sistema físico e, em muitos casos, são sintetizados para comunicação entre 
humanos ou entre humanos e máquinas. 


De modo geral, sinais podem ser classificados da seguinte forma [Lathi 1998]: 
e sinais de energia e de potência; 

e sinais periódicos e aperiódicos; 

e sinais determinísticos e estocásticos; 

e sinais de tempo contínuo e de tempo discreto; 


e sinais analógicos e digitais. 


Sinais com energia finita são denominados sinais de energia, ao passo que sinais com 
potência finita e diferente de zero são denominados sinais de potência. Se um sinal for 
de energia, ele não pode ser de potência, e vice-versa. No entanto, há sinais que não são 
de energia, nem de potência. Exemplos: sinal exponencial crescente e sinal rampa. 

Sinais periódicos são tais que, para uma constante positiva Ty, denominada período, 
vale a relação f(t) = f(t + To), para todo t. Pense que um carimbo pode ser feito com 
um fragmento desse sinal de duração To. Se o sinal original puder ser reproduzido por 
“carimbadas” sequenciais e não espaçadas do fragmento, então o sinal é dito periódico 
com período Ty. Caso contrário, o sinal é aperiódico. 

Um sinal determinístico é tal que seu comportamento é precisamente conhecido para 
cada valor da variável independente. Por outro lado, caso apenas informações proba- 
bilísticas do sinal em um tempo futuro forem conhecidas, por exemplo, valor médio e 
variância, o sinal é dito estocástico. 

Em relação à continuidade ou discretização no tempo e analogicidade ou digitalização 


em amplitude, pode-se ter a seguinte classificação: 


e Sinais analógicos de tempo contínuo são definidos ao longo de todos os instantes 
de tempo e as amplitudes podem assumir qualquer valor real. São geralmente 


denominados apenas sinais analógicos. 
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e Sinais analógicos de tempo discreto são definidos em instantes discretos de tempo, 
mas as amplitudes podem assumir qualquer valor real. Podem ser matematica- 


mente representados como sequências de números. 


e Sinais digitais de tempo contínuo são aqueles definidos ao longo de todos os ins- 
tantes do tempo, porém os valores de amplitude são definidos apenas em alguns 


valores discretos predefinidos. 


e Sinais digitais de tempo discreto são aqueles em que ambos o tempo e a amplitude 


são discretos. São geralmente denominados apenas sinais digitais. 


A Figura 1.1 ilustra a classificação dos tipos de sinais quanto à discretização e quan- 
tização. 

Um sinal também pode se classificado quanto à causalidade. Um sinal que só se inicia 
a partir de t > 0 é denominado sinal causal, ao passo que um sinal que se inicia antes 
de t = 0 denomina-se sinal não causal. Ainda, um sinal que se extingue para t > 0 é 
chamado de sinal anticausal. 

Da mesma forma podemos classificar os tipos de sistemas de interesse aos nossos 


propósitos. 


e Sistemas de tempo contínuo são sistemas em que ambas a entrada e a saída são 


sinais de tempo contínuo. 


e Sistemas de tempo discreto são aqueles em que ambas a entrada e a saída são 


sinais de tempo discreto. 


e Sistemas digitais de tempo discreto são aqueles em que ambas a entrada e a saída 


são sinais digitais de tempo discreto. 


Um sistema causal é aquele em que a saída atual depende apenas de entradas passadas 
ou presentes. Um sistema físico é causal pois, caso contrário, ele teria capacidade de 
antecipar saídas futuras. 

Os controladores abordados neste livro consideram sistemas lineares e invariantes 
no tempo (LITs). Tais sistemas respeitam o princípio da superposição, ou seja, a saída 
gerada pela combinação linear de diferentes sinais de entrada é igual à mesma combina- 
ção aplicada aos sinais de saída gerados pelos sinais de entrada individualmente. Além 
disso, sistemas LIT respeitam o princípio da invariância no tempo; um sistema é dito ser 
invariante no tempo se um retardo ou avanço de tempo do sinal de entrada causar em 


um deslocamento de tempo idêntico ao sinal de saída. 
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a) Sinal analógico de tempo b) Sinal analógico de tempo 
contínuo discreto 
t n 
c) Sinal digital de tempo contínuo d) Sinal digital de tempo discreto 


Figura 1.1 — Classificação de sinais considerando discretização e quantização. 


1.2 Amostragem periódica 


Sinais de tempo discreto são matematicamente representados como sequências de 
números. Uma sequência é uma função cujo domínio é o conjunto dos números inteiros. 


Formalmente, uma sequência x é escrita como 
x = {xz[n]}, -co<n<o, (1.1) 


onde n é um número inteiro. Em um cenário prático, tais sequências podem ser oriundas 
da amostragem periódica de um sinal analógico. Neste caso, o valor numérico do n-ésimo 
elemento na sequência é igual ao valor do sinal em tempo continuo, x(t), no instante nT, 
i.e., 


x [n] = x (nT), —oo<n< œ. (1.2) 


A quantidade T, é denominada período de amostragem, e sua recíproca é a frequência 
de amostragem fs ou ws = 27 fs. 

Na amostragem periódica o período T, é constante (veja Figura 1.2). Apesar de a 
abscissa da sequência ser uma linha contínua, é importante reconhecer que x[n] é definida 
apenas para valores inteiros de n. Não é correto pensar que x[n] vale zero quando n nao 
é inteiro; x[n] simplesmente não é definida para valores não inteiros de n. 

O teorema de amostragem estabelece a mínima frequência que um sinal analógico 


precisa ser amostrado para posteriormente poder ser reconstruído. Tal teorema afirma 
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s+ 27, T, 0 T; 27, 37,47, 5I, +++ tempo, f 


+ + + + + + + + + - > 
‘e+ 2 -1 0 1 2 3 4 5 «s» amostras, n 


Figura 1.2 — Relação entre sinal de tempo continuo e sinal de tempo discreto. 


que a frequência de amostragem deve ser maior ou igual a duas vezes a maior componente 


de frequência do sinal. Detalhes serão apresentados no Capítulo 2. 


1.3 Conversores A/D e D/A 


Um ponto crítico em sistemas digitais é a interface entre um circuito analógico e um 
digital, uma vez que a qualidade de seu projeto está diretamente relacionada a precisão, 
rapidez de resposta e confiabilidade no processamento digital de informações. 

A resolução de um conversor A/D, quando expressa em bits, é igual ao número de bits 
do conversor. Por exemplo, um conversor com uma resolução de N bits pode representar 
2N níveis de amplitude quantizados. 

O intervalo de escala (FSR, full-scale range) do conversor é definido por 
FSR = (Viet — Vet-), em que Vier, e Vref- representam, respectivamente, os ex- 
tremos superior e inferior em que a tensão de entrada pode ser convertida (codificada). 

Quando expressa em tensão, a resolução é a menor variação que pode ser identificada 


em uma escala analógica, ou seja, 


= ~ (18) 

Q também é referenciada como 1LSB (um Bit Menos Significativo - one Least Signi- 

ficant Bit). Exemplo: Para Viet- = OV, Vrery = 5V e N = 10 bits, tem-se Q = 0,0048 V 

(4,8 mV). A Figura 1.3 apresenta a relação entrada-saída de um exemplo de conversor 
A/D. 

Suponha um conversor A/D de quatro bits, com Vier = 5 V, Vef- = 0 V, e que o 


valor da conversão em binário seja 1101. A tensão de entrada, então, é 


22 Controle Digital Aplicado 


0x003- 


Saída Codificada 


0x002 


0x001-- 


0x000 


| 
| 
| 
| 
| 
| 
| 
| 
l 
| 
| 
| 
| 
SS COOPER 
A N m 


19 19 19 O ao Q g E Q 
S a N 03 a aq So 
+ Ss 

— re 


Entrada Analógica 


Figura 1.3 — Relação entrada-saída de um conversor A/D unipolar ideal. 


1x 2?+1x2?4+0x2!41 x 2° 
Via, = 5% ( z ) = 4,0625 V. 
O erro de quantização do conversor expressa o desvio do resultado de conversão em 


relação a uma reta ideal. A magnitude do erro vai de 0 a Heh 


A primeira etapa da conversão A/D é a discretização no tempo. Isso é fisicamente 
implementado por um circuito denominado amostra e retém (S-H, sample-and-hold), 


como ilustrado na Figura 1.4. 


Entrada Saída 


l | 

Analógical | Digital 
I h 
— 


Figura 1.4 — Circuito S-H na entrada do A/D. 


Tal circuito amostra o sinal de entrada a uma taxa de amostragem determinada por 
um clock e segura o nivel do sinal em um capacitor até o próximo pulso de clock, como 


ilustrado na Figura 1.5. 


Introdugao 23 


OV 


Figura 1.5 — Entrada e saida tipica de um circuito S-H. 


O tempo de aquisição é o tempo necessário para que o circuito S-H permaneça no 
modo amostragem de forma que o capacitor atinja a tensão de entrada. Uma nova 
aquisição não começa até que uma conversão tenha terminado. 

A segunda parte consiste na quantização dos níveis de tensão constante da saída do 


S-H em códigos binários pelo conversor analógico /digital, como ilustrado na Figura 1.6. 


1 1 I 1 1 
1 1 I I I 
A/D 1010010101, 1100/1010 
if I 


in mn sas a 


l 
1 
| 1 | 
| I I 
| 1 I 
Po + 
[O a E OR | 
I l 1 | I 
I l 1 I I 
ra 1 I I 
tod 1 | I 
I ot I | I 
Lobo ro rol 
i tf dd 
oa 1 1 I 
LL | 4 


Figura 1.6 — Conversao efetuada por um exemplo de A/D. 


O tempo de conversão é o tempo necessário para se obter o valor digital na saída da 
tensão analógica de entrada. Note que o tempo de conversão não pode ser maior do que 
o tempo em que o sinal permanece constante. 

Os circuitos integrados denominados conversores A/D possuem, internamente, o S-H 
e a conversão A/D propriamente dita, incluindo um, dois ou mais canais. 

Há diversas formas de conversor A/D, tais como: flash, aproximações sucessivas, 
rampa, rampa dupla tipo integrador, tensão-frequência, sigma-delta. 

A Figura 1.7 seguinte ilustra um exemplo de conversor A/D tipo flash. Tal conversor 
é rápido, mas necessita de 2” comparadores para a conversão com n bits. O codificador 
de prioridade produz um código binário correspondente à entrada de mais alta ordem 
acionada. No conversor por aproximações sucessivas, a conversão é realizada do bit mais 
significativo (MSB) para o menos significativo (LSB). O sinal de entrada é comparado ao 
valor analógico que representa o código binário na saída do registrador de aproximações 


sucessivas (SAR). Se o sinal de entrada for maior, o bit 1 no MSB é mantido no SAR. 
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Figura 1.7 — Conversor A/D flash. 


Caso contrário, tal bit fica em “0” (reset). Uma vez que o MSB representa metade da 
tensão de referência, conhecer o estado deste bit (0 ou 1) já significa saber se a tensão de 
entrada é maior ou menor que a metade da referência. Conhecido o bit mais significativo, 
passa-se ao próximo bit, que representa 1/4 da tensão de referência. A conversão segue 
assim até o LSB. A Figura 1.8 apresenta um esquema do conversor por aproximações 
sucessivas. 

Por outro lado, conversores D/A convertem uma palavra digital em um sinal ana- 
lógico sob a forma de uma tensão ou corrente de saída. São formados por elementos 
passivos, fontes de referência, chaves e amplificadores operacionais. 

A Figura 1.9 apresenta um conversor D/A com resistores proporcionais. O valor de 


tensão convertido é dado por 


Ry 1 1 
Vout = (da + 500+ jh + 


1 
bo | Vret: 1.4 
R o) Vet (1.4) 


8 


Outra forma de se implementar um conversor D/A é utilizando uma rede R — 2R. 
A vantagem é que apenas dois valores de resistência são necessários, conforme visto na 
Figura 1.10. 
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Conversor 


D/A 


Registrador de 
Aproximações 


Figura 1.9 — Conversor D/A com resistores proporcionais. 


Pode-se mostrar que a saída é proporcional ao peso da combinação binária que está 


em nível alto, tal que 


ll 1 1 i 
Vout = 2 (da F 502 F qa + do) Viet. (1.5) 


8 


A conversão D/A também pode ser indiretamente feita considerando a modulação por 
largura de pulso (PWM, Pulse Width Modulation). Trata-se de um sinal com frequência 
constante e largura de pulso (ciclo ativo ou duty cycle) variável. Vários microcontrola- 
dores e processadores digitais de sinais possuem uma função para gerar sinal modulado 
com largura de pulso proporcional a um determinado número de bits (sinal digital). A 


variação da largura do pulso permite obter uma tensão média variável. O sinal PWM 
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Figura 1.10 — Conversor D/A com rede R — 2R. 


em um período pode ser representado por 


Voo, O<t<t 
Rig) oa, (1.6) 
0, tp<t<T 


onde T é o período da forma de onda, tp a duração do pulso em nível alto e Vpulso à 


tensão de pulso. Assim, a tensão média do sinal PWM é dada por 


; ts a 
t 
Vu = T | Voaodt + f oat = = pulso: (1.7) 
0 


tp 


O ciclo ativo (duty cycle) corresponde à razão entre a largura do pulso em nível alto e 
o período do sinal (tp/T). O pulso da onda PWM apresenta tensão fixa, porém a tensão 
média (Vm) é diretamente proporcional ao ciclo ativo e, como este varia entre 0 e 1, Vm 
pode variar entre 0 e Vpulso- Para se obter um conversor D/A a partir de uma saída PWM 
de um hardware digital, basta adicionar à saída um filtro passa-baixas com frequência 
de corte menor (pelo menos 10 vezes) que a frequência do PWM, como apresentado na 
Figura 1.11. 


R 
C Microcont. 1 < Í PWM 


p= < 
ou e 
DEP 27RC 10 


out 


Figura 1.11 — Conversor D/A PWM. 
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Para controlar resisténcias de aquecimento e ventiladores, por exemplo, nao ha neces- 
sidade de filtro, desde que a frequéncia do PWM nao seja muito baixa. Pode-se, portanto, 
regular a taxa de aquecimento do resistor e a velocidade do ventilador, variando-se a ten- 


sao média aplicada a eles. 


1.4 Introdução ao controle digital 


Ao longo deste texto, por abuso de notação, o termo controle digital será usado 
para fazer referência ao controle em tempo discreto com amplitudes quantizadas, ou 
seja, processado por um hardware digital. Por simplicidade, os termos controle digital e 
controle discreto serão considerados sinônimos aqui, apesar de digital e discreto serem, 
essencialmente, conceitos diferentes, como visto na classificação de sinais apresentada na 
Seção 1.1. 

A Figura 1.12 apresenta a topologia típica de um sistema de controle com compen- 


sação em série e realimentação unitária. 


Figura 1.12 — Sistema de controle com realimentação unitária. 


Por outro lado, a Figura 1.13 apresenta o mesmo sistema, mas com o controle im- 


plementado de forma discreta. 


Figura 1.13 — Sistema de controle com realimentação unitária em tempo discreto. 


O período de amostragem é dado por Ts. Considere as seguintes definições: 


e r(t)er[n] =r(nT;): sinal de referência (set-point) em tempo contínuo e em tempo 


discreto, respectivamente; 
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e e[n] =e(nT;): sinal de erro atuante em tempo discreto; 


e y(t) e y[n] = y(nT;): variável controlada (ou regulada) em tempo contínuo e em 


tempo discreto, respectivamente; 


e u(t) e uln] = u(nT;): sinal de controle (variável manipulada) em tempo contínuo 


e em tempo discreto, respectivamente. 


Note que agora o controlador não pode mais ser implementado de forma analógica. 
Uma das formas! de fazer com que um hardware digital produza uma solução que se 
aproxime da solução em tempo contínuo com dinâmica é denominada método de Euler 
por diferença em avanço (forward rectangular). Note que a derivada de x em relação ao 
tempo, no instante t = nT, pode ser aproximada por 


' x([n +1/]T,) — x(nT, 
(Dean, = EUT) on) (13) 
s 
O importante é observar que uma derivada foi transformada em uma diferença pon- 
derada. De forma geral, uma equação diferencial é transformada em uma equação de 


diferenças. A equação de diferenças é resolvida repetidamente a cada intervalo de tempo 


T;. O Exemplo 1.1 ilustra o método de discretização por diferença em avanço. 


'Outras formas melhores do que essa serão consideradas no Capítulo 4. 
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Amplitude 


wf Controle Contínuo | 
Controle Discreto 
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0 0,5 1 15 2 0 0,5 i LE 
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Figura 1.14 — Resposta ao degrau do Exemplo 1.1 com (a) fs = 20 Hz e (b) 
fs = 40 Hz; 


Capitulo 2 


Amostragem e Reconstrucao 


Neste capitulo é apresentada uma revisao sobre amostragem periddica de sinais. A 
reconstrução de sinais limitados em banda a partir de suas amostras também é conside- 


rada. 


2.1 Amostrador ideal 


O amostrador ideal toma amostras periódicas de x(t) para produzir v(nT;). Do 
ponto de vista matemático, o processo de amostragem é idealmente representado por 
uma modulação impulsiva, ou seja, x(t) é multiplicado por um trem de impulsos a(t) 


dado por 


oo 


a(t)= Y 5(t-nT,), (2.1) 


n=— 00 
em que ô(t) é a função impulso unitário ou delta de Dirac. Tal função tem valor não nulo 
somente quando o seu argumento for igual a zero, ou seja, quando t = nT. O resultado 
da multiplicação é o sinal za(t) dado por 


co 


00 
Za (t) =a(t)x(t)=a(t) Y) 5(t-nT.)= Y z(nT,)5(t-—nT,). (2.2) 
n=—0o n=-—00 
A Figura 2.1 representa a amostragem ideal por trem de impulsos. 
A Figura 2.2 ilustra o processo de amostragem no dominio da frequência. O espectro 
do sinal amostrado é composto por uma soma de infinitas cópias do espectro do sinal (de 
entrada) de tempo contínuo, cada qual deslocada por um múltiplo inteiro da frequência 


de amostragem (veja Figura 2.2.(c)). Analisando a Figura 2.2.(c) é possível concluir que: 
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x(t) x (t) 


+y 


ss -27,-T, 0 T; 27, 37,47, ST, *** 


Figura 2.1— Amostragem por trem de impulsos. 


e O sinal de entrada x(t) pode ser reconstruído a partir do sinal amostrado se esse 
for filtrado por um filtro passa-baixas ideal com frequência de corte em ws/2 (veja 
Figura 2.2.(d)). 


e À afirmação anterior só será válida se a banda do sinal de entrada for menor que 


w,/2, isto é, Wm < ws/2 ou ws > 2Wm. 


A Figura 2.3 ilustra o caso em que wm > ws/2. Quando isso ocorre, há sobreposição 
das cópias de X (w) e, mesmo com o filtro passa-baixas ideal, não é possível recuperar 
o sinal de entrada. Compare os espectros ilustrados na Figura 2.3.(a) e Figura 2.3.(d) e 
verifique. 

A situação wm > ws/2 resulta em aliasing, que pode ser traduzido do inglês como 


rebatimento. 
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Figura 2.2 — Análise no dominio da frequência de amostragem e reconstrução 


sem aliasing. 


2.2 Teorema da amostragem 


Enuncia-se a seguir o teorema da amostragem de Nyquist-Shannon, o qual é a base 


para o estudo de sinais amostrados. 
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Espectro do sinal de tempo (a) 
contínuo 


(b) 


Espectro do sinal 
amostrado 


Resposta em frequéncia do 
filtro de reconstrução ideal 


Espectro do sinal 
reconstruído 


Figura 2.3 — Análise no dominio da frequência de amostragem e reconstrução 


com aliasing. 


Teorema 2.2.1 (Teorema da amostragem) 

Seja um sinal x(t) de tempo contínuo limitado em banda, tal que X (w) = 0 para 
w| > wm. O sinal x(t) será unicamente determinado por suas amostras x[n] = x(nT;s), 
somente se 


Ws = 2Wm- (2.3) 


A frequência wm é conhecida como frequência de Nyquist e a frequência 2w,,, a qual 


deverá ser excedida pela frequência de amostragem, é conhecida como taxa de Nyquist. 


Um aspecto importante consiste na escolha do período de amostragem adequado. 
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Pode-se pensar que, quanto menor, melhor. No entanto, o “quanto menor” esbarra em li- 
mitações do hardware digital, além de poder resultar em problemas numéricos de precisão 
dos parâmetros do algoritmo de processamento (controle) digital. 

De forma geral, além de respeitar o teorema da amostragem, um aspecto prático para 
sistemas de controle consiste em escolher Ts pelo menos 10 vezes menor do que o período 
das oscilações de saída, se a resposta transitória for subamortecida, ou 10 vezes menor do 
que o tempo de subida, se a resposta for amortecida [Castrucci, Bittar e Sales 2018]. Os 


Exemplos 2.1 e 2.2 seguintes são sobre escolha adequada de frequência de amostragem. 
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Figura 2.4 — Análise no domínio da frequência dos sinais do Exemplo 2.1.b. 
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sinal de entrada e sinal 


Fá reconstruído. 


sinal 


amostrado 


Amplitude 


1 
tempo (ms) sinal 


T sinal de entrada reconstruído 


sinal 


amostrado 


Amplitude 


tempo (ms) 


Figura 2.5 — Representação no dominio do tempo dos sinais do Exemplo 2.1. 


Note que as sequências 21 [n] e x2[n] são idênticas, caracterizando aliasing. De forma 


geral, observe que 


cos (ont tt) IGOS (2nfn + 2mn) = cos (2n4n) , 


ou seja, qualquer senoide com frequência f = fo + fs irá produzir a mesma sequência 


quando amostrada com frequência de amostragem fs. 


2.3 Reconstrução de sinal em tempo discreto 


O filtro passa-baixas ideal de reconstrução tem resposta em frequência dada por (veja 
Figura 2.3(c)) 


Ts, < ws/2, Ts, < T/Ts, 
H, (w) = lol < ws/ ou H,(w)= kol Sa/ (2.4) 
0, caso contrário, 0, caso contrário. 


A resposta ao impulso desse filtro é dada pela transformada inversa de Fourier de 
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1 co . To T/Ts . 
hr (t) = Sar J. Hy (w) e td = = | a elt day 


E ey É ps E 
— n/Ts 


T 2 jt 


t/Ts) 
= es = sinc (mt/Ts), (2.5) 
e possui a forma da Figura 2.6. 
1,0 
0,8 


-4 -3 -2 -1 0 1 2 3 4 
HT 


Figura 2.6 — Resposta impulsiva do filtro interpolador ideal. 


O sinal reconstruído é dado pela convolução entre o sinal amostrado e a resposta ao 
impulso do filtro, isto é, 


2y (t) = Za (t) * hy (t). (2.6) 


Note que o sinal amostrado x, (t) pode ser escrito como 


oo oo 


Talt) = Y a(nT,)5(t—nTs)= Y alnjô(t-nTo), (2.7) 
o que resulta em 


Lele) = sa eh f. Za (T) hy (t — 7) dr 


co 


E. Ys [n] 8 (7 = nT.) sine (* Jar 


ô (T — nT,) sinc 2) dt 


y a [n] sinc (2) (2.8) 


n=—00 


co 00 


II 
pe] 
8 
E 
ea 
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Portanto, idealmente, ao respeitar o teorema da amostragem, a partir da sequência 
x[n] é possível obter o valor de x, (t) para qualquer instante de tempo, e não somente 


para os pontos em que o sinal de entrada foi amostrado. 


A reconstrução representa um processo de interpolação, como ilustrado na Figura 


2.7.(c), onde várias realizações de x [n] sinc (7 (t — nT5)/Ts) são apresentadas. 


Figura 2.7 — Interpolacáo ideal: (a) sinal limitado em banda (x(t)); (b) sinal 
amostrado (xa(t)); (c) representação do sinal reconstruído ideal- 
mente (2, (t)). 


Como observado, teoricamente, com tal interpolacáo é possível reconstruir o sinal 
perfeitamente. No entanto, o filtro passa-baixas ideal nao é fisicamente realizável, pois 
ele é não causal. Em muitas aplicações a não causalidade pode ser resolvida adicionando 
um atraso de fase dado por e~J** em H,(w) (que corresponde a um atraso de A no 
tempo) e efetuando um truncamento da resposta impulsiva. Em aplicações em tempo 
real, como sistemas de controle com realimentação, o atraso adicionado é desastroso para 


a estabilidade do sistema. Por este motivo é que se utilizam os seguradores polinomiais. 
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2.4 Segurador de ordem zero 


Em particular, o segurador de ordem zero apresenta uma resposta impulsiva como a 


mostrada na Figura 2.8. 


Figura 2.8 — Resposta impulsiva do ZOH. 


Na conversáo A/D, um segurador de ordem zero é agregado ao circuito S-H. A con- 
versáo D/A também possui por um segurador que extrapola (“liga”) o sinal entre dois 
pontos consecutivos (amostras consecutivas). Na conversáo D/A, o segurador náo pre- 
cisa necessariamente ser de ordem zero. O segurador de ordem zero produz um sinal na 
forma de escada, como mostrado na Figura 2.9, e é comumente utilizado em sistemas de 


controle digital. 


amostras 
Saída ZOH 


t 


Figura 2.9 — Entrada e saida de um segurador de ordem zero. 


Matematicamente, 
zoh(t) = u(t) — u(t — Ts), (2.9) 


onde u(t) é a função degrau unitário. A transformada de Laplace de zoh(t) é dada por 


ZOH(s) = / [u(t) — u(t — T,)] e” dt 


Ts —sT. 
= s 
= fera- Set e _ (2.10) 
0 S 
0 
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A transformada de Fourier do ZOH é dada por 
—jwTs jwTs/2 _ ¿—jwTs/2 
ZOH(w) = a io = e IeTs/2 el A e jwTs / vA 
jw jw ITs 


Te ivTs/2 RE ge = Te ivTo/? sen (wT, /2) 
é 23 (wT; /2) é wTs/2 


= e IvTs/2 T sinc (wT, /2) . (2.11) 


Note que o ZOH introduz um deslocamento de fase igual a wT; /2, o que corresponde 


a um atraso no tempo de T,/2. A Figura 2.10 ilustra esse atraso. 
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Figura 2.10 — Efeito do ZOH. 


Capitulo 3 


Transformada- z 


Este capítulo apresenta uma revisáo sobre a transformada-z. Na análise de sistemas 
em tempo discreto, ela faz o papel que a transformada de Laplace faz para sistemas em 
tempo contínuo. 

Considere que o sinal em tempo discreto s[n] = x(nT;) foi obtido por amostra- 
gem periódica. A transformada-z (bilateral) de uma sequência x[n] é definida como 
[Oppenheim, Schafer e Buck 1999] 

+00 


2 {x nl =X(2)= y x(n] 2". (3.1) 
n=—00 
Trata-se de uma série de poténcia infinita, em que z é uma variável complexa contí- 
nua. Para sinais causais, o foco deste livro, tem-se a transformada-z unilateral 


+o0 


Z {a [n]) = X (2) = 5 ame (3.2) 


n=0 


A seguir são apresentados alguns exemplos de cálculo da transformada-z (Exemplos 
3.1 a 3.6): 


43 


44 Controle Digital Aplicado 


Figura 3.1 — Plano-z e ROC do Exemplo 3.1. 


A definição da região de convergência é importante, pois dois sinais diferentes, um 
causal e um anticausal, podem ter a mesma expressão algébrica de X(z) !. Logo, uma 


transformada-z bilateral só é completamente definida se a ROC for especificada. 


Calcule, por exemplo, a transformada-z de —ua[—n — 1], sendo uq[n] definido no 


Exemplo 3.1, e compare com o resultado da transformada-z de ug|n]. 
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Figura 3.2 — Plano-z e ROC do Exemplo 3.3. 
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No MATLAB®, o comando ztransf () do Toobor de matemática simbólica pode ser 


utilizado para obter a transformada-z. O MATLAB® considera que a variável amostrada 


48 Controle Digital Aplicado 


independente é n e que a variável independente transformada é z. Para exemplificar 
o uso desse comando, apresenta-se a seguir a solução do Exemplo 3.2 diretamente no 
MATLAB®: 


clear alls eles 


syms n T_s; /Define n e T_s como vars. simbólicas 
x=n*T_s; %Define x[n] = x(nT_s) = nT_s 
disp('x(n) = '); 

pretty (x); “Forma "bonita" de x(nT_s) 

X=ztrans (x); %Obtém X(z) = Z{x(n)} 

disp('X(Z) = '); 

pretty (X); %Forma "bonita" de X(z) 


3.1 Relação entre as transformadas z e de Laplace 


Como visto na Equação (2.2), o sinal amostrado pode ser representado por 


co co 


zs(t)= >, 2(t)6(t—nT,)= Y” x[njó(t -nT,). (3.3) 


n=-—00 n=—00 
Ao aplicar a transformada de Laplace na equação anterior, verifica-se que 


x (9-2) E, dot nt} = Y ane {6(t — nT,)}, (3.4) 


n=—00 n=— 00 


sendo £ {-} o operador transformada de Laplace. Como £ {5(t — nT,)) = e-*"Ts, tem-se 


Xs(s) = E, ahe a; (3.5) 
Por outro lado, como 
Ma= >, ahe”, (3.6) 


pode-se verificar que a transformada-z da sequência x[n] obtida pela amostragem de x(t) 
é equivalente à transformada de Laplace do sinal amostrado xs(t), com z = e*%s ou 
s= (1/T,) In(z). 


Como s = g + jw é uma variável complexa, tem-se que 
Ts (o+jw) = els? eiTsw Z obs? ei (Tswt2rk) (3.7) 


2=e€ 


Observe que: 
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e Qualquer ponto no plano-s onde as frequências diferem em múltiplos inteiros da 


frequência de amostragem ws = 27 /T, são mapeados no mesmo ponto no plano-z. 


e Pontos sobre o eixo jw no plano-s correspondem a pontos sobre circunferência 


unitária, |z| = 1, no plano-z. 


e Todos os pontos no semiplano esquerdo do plano-s correspondem a pontos no 


interior do círculo unitário no plano-z. 


e Todos os pontos no semiplano direito do plano-s correspondem a pontos fora do 


círculo unitário no plano-z. 


Portanto, a região de estabilidade no plano-z é o interior do círculo unitário. 
O semiplano esquerdo do plano-s pode ser dividido em um número infinito de faixas 


periódicas, como mostrado na Figura 3.3. A primeira faixa, ou faixa primária, vai de 


jw = —jws/2 a jws/2. As faixas complementares vão de jw = jws/2 a jus 3/2, 
jw = jus 3/2 a jus 5/2,...,ede jw = —jws/2 a —jws 3/2, ju = —jws 3/2 a 
—jws 5/2, ou 

"i plano-s 


Figura 3.3 — Faixas periódicas no semiplano esquerdo do plano-s e mapeamento 


correspondente no plano-z. 
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3.2 Função de transferência 


Considere um sistema linear e invariante no tempo com entrada r[n] e saída yn], 


caracterizado pela seguinte equação de diferenças: 
T, 
yin] = yin — 1] + > (rln] + rin — 1). (3.8) 


A transformada-z do termo y[n — 1] é dada por 


co 


> y(n — 1] 2-" = 2" Y(z). (3.9) 


n=0 
Ao aplicar este resultado na Equação (3.8), resulta em 


Y(z) =z 1Y(z)+ à (R(z) + 2" R(z)). (3.10) 


Rearranjando os termos, tem-se 


_Y(z)_ Tsl+x* Toz+1 


So md” E f=e Ea 


(3.11) 


A razão entre a transformada-z da saída pela transformada-z da entrada de um 
sistema LIT, assumindo condições iniciais nulas, é a função de transferência do sistema. 


De forma geral, a relação 


= bo + biz”! +: +Fbmz" 


G 5 a 
[p= Be (3.12) 
com n > m, pode ser escrita como 
nh, b n—1 at bm n—m B 
ay PyME eri ey (3.13) 


zr + az” l + ---+an A(z) 


A função tf O) do MATLAB® pode ser utilizada para definir um sistema LIT em 
termos de sua função de transferência, tanto em s quanto em z. Para criar um modelo de 
sistema de tempo contínuo no MATLAB® na forma de função de transferência, pode-se 


fazer 


num Gs = [1 1]; %Numerador de G(s) 

den_Gs = [1 5 6]; %Denominador de G(s) 

%Cria uma função de transferência G(s) 

G = tf(num_Gs, den_Gs); 

hou 

4s = tf('s'); G = (sti)/(s72+5*st6) ; 

Linha seguinte gera sys com um atraso de transporte de 1 s, 


hou seja, G = exp(-1*s)*(st1)/(s72+5*st6) 
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No caso de sistemas em tempo discreto, uma função de transferência em z pode ser 


definida como 


num Gz = [1 2 7]; /Numerador de G(z) 

den_Gz = [1 -0.3 0.02]; %Denominador de G(z) 

T_s = 0.5; %Periodo de Amostragem 

G = tf(num_Gz,den_Gz,T_s); 

Se o per. de amost. for indeterminado, pode-se fazer 
G = tf (num Gz,den Gz,[]); hou G = tf (num Gz,den Gz,-1); 
hPode-se ainda fazer 

zZsti("z2" , Ted 

G=(z72+2*z+7) /(z72-0.3*z+0.02) ; 

hSe o per. de amost. for indeterminado, pode-se fazer 
z=ti('z'); 

G=(z72+2*z+7)/(z72-0.3*z+0.02) ; 

%Para atribuir um per. de amost. a G(z), pode-se fazer 
Gite = T.E% 


3.3 Polos e zeros no plano-z 


Considere B(z) e A(z) os polinômios do numerador e do denominador de G(z), res- 
pectivamente. As raízes da equação B(z) = 0 são denominadas zeros de G(z), enquanto 
as raízes de A(z) = 0 são denominadas polos de G(z). Após fatoração, G(z) pode ser 


reescrita na forma zero-polo-ganho (zpk): 


Q 

ey 

I 

N 

Los 
É 
| 

x 


(3.14) 


3 


Il e-r) 


2 


Il 
fe 


A função zpk() do MATLAB® pode ser utilizada para definir um sistema LIT em 
termos de sua função de transferência, tanto em s quanto em z, com ganho, polos e zeros 
fatorados. Para criar um modelo de sistema de tempo contínuo utilizando zpk(), pode-se 


fazer 


K = 10; %Ganho de G(s) 

zer Gs = [-0.1 -0.2]; %Zeros de G(s) 

pol. Gs = [-0.3 -0.4]; %Polos de G(s) 

/Cria uma função de transferência G(s) fatorada 

G = zpk(zer_Gs, pol_Gs,K); 

hou, por exemplo 

hs = zpk('s'); G = (10*s72+3*s+0.2)/(s72+0.7*s+0.12) 
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No caso de sistemas em tempo discreto, pode-se definir 


K = 10; %Ganho de G(z) 

zer Gz = [-0.1 -0.2]; %Zeros de G(z) 

pol Gz = [-0.3 -0.4]; %Polos de G(z) 

T.s = 0.5; YPeríodo de Amostragem 

G = zpk(zer_Gz,pol_Gz,K,T_s); 

hSe o per. de amost. for indeterminado, pode-se fazer 
G = zpk(zer Gz,pol Gz,kK,[]); hou G = zpk(zer_Gs,pol_Gs ,K,-1); 
%Pode-se ainda fazer 

z=zpk Cz" o T_895 

G=(10*272+3*zZ+0.2) /(z72+0.7*z+0.12); 

hSe o per. de amost. for indeterminado, pode-se fazer 
z=zpk('z'); 

G=(10*272+342+0.2)/(272+0.7x2+0.12); 

%Para atribuir um per. de amost. a G(z), pode-se fazer 
G.Ts = T_s; 


3.4 Sistema LIT causal e estável 


Suponha que g[n] seja a resposta impulsiva discreta de um sistema linear e invariante 


no tempo. Para que o sistema seja causal, 
g[n]=0, n<o0. (3.15) 


Este sistema será estável no sentido BIBO (Bounded Input Bounded Output) se e 


somente se 


> |g [nl] < oo. (3.16) 
n=0 


Para sistemas causais a ROC é determinada por uma regiao externa de um disco 
centrado na origem (veja Exemplo 3.1). Por outro lado, como a ROC de qualquer sistema 
nao pode conter polos, entao a ROC de um sistema LIT causal deve comegar a partir 
do polo de maior médulo (mais externo) conforme ilustra a Figura 3.4. Além disso, para 


que um sistema seja estável, a ROC deve conter o círculo unitário. Conclusão: 


Os polos de um sistema LIT causal e estável devem estar localizados estritamente 


dentro do círculo unitário. 


A Figura 3.4 ilustra um exemplo de sistema estável e causal ao mesmo tempo. Note 


que se algum polo estiver fora do círculo unitário, o sistema causal não é estável. 
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círculo unitário 
plano-z unitári 


ROC 


Figura 3.4 — Plano-z e ROC para um sistema LIT estável e causal. 


3.5 Algumas propriedades da transformada-z 


As propriedades aqui apresentadas podem ser utilizadas para facilitar o cálculo de 
transformadas diretas, inversas ou como método indireto para solucionar outros proble- 
mas. Será considerado que as sequências x[n] e y[n] foram obtidas pela amostragem 
periódica, com período Ts, de sinais contínuos x(t) e y(t), respectivamente, ambos com 


valores nulos para t < 0. 


e Linearidade 


2 {ax [n] +ou} = So arp] + by in)" =a tolo” 
n=0 n=0 
+b > uhle” 
= aZ {ax [nj} +62 {y[n]}. (3.17) 


Essa propriedade mostra que a transformada da soma é a soma das transformadas e 
que, ao multiplicar uma sequéncia no dominio do tempo por uma constante, sua trans- 


formada também será multiplicada pelo mesmo valor. Isso pode ser representado como 


ax [n] +by[n] <> aX (2) +0Y (2). (3.18) 
e Atraso 
Z(v|n—-no] = 5 x[n — no] 2" = >, a [m] ¿("+70 m=n- no 
n=0 m=—no 
= g 5 zme = Za [np (3.19) 


m=0 
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Como x[n] = 0 para n < 0, o limite inferior na segunda linha da equação anterior pode ser 


modificado para m = 0. Essa propriedade mostra que atrasar uma sequência no tempo 


por no amostras para direita é equivalente a multiplicar sua transformada por z—~"°, ou 


seja, 
x [n — no] Es prox (2). 
e Avanço 
oo oo 
Z{a|[n+no]} = Y 2 [n+ no] 2” = $ r|m] 22") m=n-no 
n=0 m=no 
oo no—1 
= ga y z [m] 27™ — z”? y oime m. 
m=0 m=0 
Portanto, 
no—1 
a [n + no] = ZX (2) — 2 5 a[m]z"". 
m=0 
e Escalonamento no domínio-z 
steam Sean Et" =x 
fa” x[n]) 28 x|n]z dan E E 
ou seja, 
a” x[n] o X (=) 
a 


e 
Sa 
>< 
E 
II 
l 
x 
S|a, 
AA, 
NE 
8 
3, 

x 
3 
xa 
II 
l 
x 
Me 
Sl 
8 
z 
x 

| 
3 


(3.20) 


(3.22) 


(3.23) 


(3.24) 


(3.25) 
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Observe que multiplicar uma sequéncia no tempo por n é equivalente a derivar a sua 


transformada-z e multiplicar por —z. 


nh E 25X toy (3.26) 


e Teorema da Convolução 
A convolução entre duas sequências é equivalente ao produto entre suas transforma- 


das. 


a [n] x g [n] Es X (z) G (2). (3.27) 


Em um sistema LIT com resposta ao impulso g[n], entrada x[n] e saída y[n], tem-se 


Y (z) 


Yiz)= MEE => Glz)= Xe 


(3.28) 


e Teorema do Valor Inicial 
Tal teorema é utilizado quando se deseja encontrar o valor inicial no domínio do 
tempo discreto, x[0], conhecendo-se somente X (z). 


x[0] = lim X(2). (3.29) 


e Teorema do Valor Final 


Por outro lado, esse teorema é utilizado quando se deseja encontrar lim x[n], conhecen- 
n—00 
do-se somente X (z). 
‘ it = geil 
im x[n] = lim (1 — 27°) X(z). (3.30) 


As provas dessas três últimas propriedades apresentadas ficam como exercícios para 


o leitor. Os Exemplos 3.7 a 3.10 seguintes usam as propriedades apresentadas. 
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sos 
A Oo CO me 


Imaginary Part 
o 
© N 


-1 -0. 


5 0 0.5 1 
Real Part 
Figura 3.5 — Plano-z com polos e zeros para o Exemplo 3.10. 


A Tabela 3.1 apresenta algumas sequências típicas causais e suas transformadas-z. 
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A sequência 0[n] é denominada impulso unitário, tal que 


ó[n] = A E ae (3.31) 


Para uma tabela mais completa, vide [Oppenheim, Schafer e Buck 1999]. 


Tabela 3.1 — Alguns pares de transformada-z unilateral. 


Sequência Transformada-z 
1 ó[n] 1 
2 d[n — ml] g™ 
1 
3 uq[n] A 
1 
4 n 
dual) 1—az! 
A main] az} 
na"uqg[n — 
: (1—a 
1 — (cos wo) z7! 
d cobaia) ma 1 — (2 cos wo) 271 + 272 
-i 
T sen(won)ua[n] a 


1 — (2 cos wo) 27t + 27? 


7 1 — (a cos wo) 27! 
11 | a” cos(won)ua[n] 1- Omen po 


(a sen wo) 27* 


1 — (2a cos wo) 27t + a?z-? 


12 | a” sen(won)ualn] 


Por outro lado, a Tabela 3.2 apresenta a relacáo entre a transformada de Laplace e 
a transformada-z obtida a partir da amostragem de alguns sinais contínuos. Uma tabela 


mais completa é encontrada em [Ogata 1995]. 


Transformada-z 


Tabela 3.2 — Pares de transformada de Laplace e transformada-z. 


X(s) x(t) x[n] X(z) 
1 1 
1 A ualt) ualn] A 
1 —at —anT. 1 
2 sta x dd E 1-e-4Tsz—1 
+ E * 
3 3 t mae. == 
T22-1(1+2-1) 
2 2 2 s 
= -aT, 
5 a l= et i e ants o Lie a 2) 
s(s+a) (1—27 1)(1—e~4Ts z—1) 
1 —at —anTs a Ai e “Ts 
6 y te nT,e Gary 
= 
w z—* sen(wTs) 
T| aãa sen(wt) sen(wnT;) maine 
s 1-2"! cos(wTs) 
É | qr cos(wt) cos(wnT;) ea 
9 | e“ sen(wt) eT sen(wnT,) oe sentia) 
(s+a)?+w? 8/|1-2e79Ts ¿1 cos(wTs)+e7 2474s ¿2 
10) 5 le“ cos(wt) |e "Ts cos(wnT;) Te) 
(s-+a)?+w? 5) | 1-2e-9Ts 2-1 cos(wTs)+e7 247s ¿2 
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3.6 Método da invariancia ao impulso 


Seja um sistema LIT com resposta impulsiva ge(t). A resposta y(t) a uma entrada 


qualquer x(t) é dada por 


at = / "abnt -rja 


= Aim, 2 x(mAr)g-(t — MAT) Ar 
= T; y a(mT;)ge(t — mTs). (3.32) 
m=0 


A resposta amostrada no instante nT, é dada por 
co 
y(nT,)= Ta >, x[m]g.((n — m)T3). (3.33) 
m=0 


Por outro lado, seja g[n] a resposta impulsiva do sistema LIT em tempo discreto 


equivalente. A resposta y[n] para a entrada x[n] é dada por 


co 


yin] = >, x[m]g[n — m]. (3.34) 


m=0 


Note que, para (3.33) ser equivalente a (3.34), deve-se ter que 
g|n| = Ts9c(nTs). (3.35) 


Essa é a relação entre a resposta impulsiva amostrada do sistema em tempo continuo e 
a do sistema em tempo discreto. Tal método de discretização recebe o nome de invariáncia 
ao impulso. Note que X(z) na Tabela 3.2 (quarta coluna), quando multiplicado por Ts, 
é o equivalente discreto de X(s) (primeira linha da Tabela 3.2), obtido pelo método da 
invariáncia ao impulso. 

No MATLAB®, o comando c2d realiza essa conversáo, com a opcáo 'imp'. Por 
exemplo, para obter o equivalente discreto de G(s) = Teton pelo método da invariancia 
ao impulso e com T, = 0,1, pode-se fazer 


a= EC's") 
0.7/(s*(s+0.7)); 
Ts = 0.1; 

G_d = c2d(G,Ts,'imp'); 


Q 
i] 


A resposta obtida é Gp = = 
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3.7 A Transformada-z inversa 


Com frequência, na análise de sistemas, é necessário realizar o processo inverso 
da transformada-z, ou seja, obter a sequência a partir de sua transformada. Esse 
processo é chamado de transformada-z inversa. Pode-se, por exemplo, utilizar uma 
tabela de transformada-z e, por meio de inspeção, obter a transformada inversa 
[Oppenheim, Schafer e Buck 1999]. 

No entanto, existe uma expressão formal para realizar esse tipo de cálculo que é base- 


ada no teorema da integral de Cauchy para variáveis complexas [Brown e Churchill 2009], 


a [n] = = f x (2) 2" dz, (3.36) 


em que C é um contorno fechado na ROC no sentido horário. A integral em (3.36) é 
resolvida pelo teorema dos resíduos de Cauchy. Alguns procedimentos para obtenção da 


inversa serão considerados a seguir. 


3.7.1 Transformada-z inversa por divisão longa 


Neste método a transformada-z inversa é obtida pela expansão de X(z) em uma série 
de potência infinita em z~!. Tal método é útil quando é difícil encontrar uma expressão 
fechada para a transformada inversa, ou quando se deseja obter apenas os primeiros 


termos de x[n]. Ele se baseia no fato de que X(z) pode ser expandida como 


X(z) = >. a[n]z"" = x[0] + z[1]z7t + 2[2]z-7 +... (3.37) 
n=0 


O Exemplo 3.11 obtém a transformada inversa por divisao longa. 


£ Exemplo 3.11: Encontre os cinco primeiros termos de x[n], dado que 


10z+5 
AE) = ; 
Gane) 
Solugao: note que 
1 —1 —2 
x= (Ma e 


o 0 oe 
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3.7.2 Transformada-z inversa por expansão em frações par- 
ciais 
Considere X(z) dada por 


X(z) e boz” + En gro + es bm-12 + bm > B(z) 


n a = => qm: 

2n + az"! +- -an-12 + an A(z)’ = 

Para expandir X(z) em frações parciais, inicialmente o denominador precisa ser fa- 
torado para encontrar os polos. Alguns casos particulares serão considerados a seguir. 


Expansão em frações parciais para A(z) com raízes distintas: 


boz” + he + +**bm-12 + bm 


H= (2 — pi)(z — po) == (2 — Dn) 


(3.38) 


Na expansão em frações parciais, para o uso mais direto de uma tabela de pares de 


transformada-z, é mais conveniente se expandir X(z)/z ao invés de X(z), tal que, 


X(z a a a 
(z) _ 1 2 Heated n 
Z Zz — P1 Z— Pa Z— Pn 


e (3.39) 
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onde az, com k = 1, 2, ..., n, é chamado de resíduo do polo em s = px. O valor de ax 
pode ser obtido como 
X(z 
= E = pr) = : (3.40) 
g Es 

2=Dk 

A transformada-z inversa de X(z) é então dada por 
sf] = 21 | Eg E ny e), (3.41) 

2=P Z—pa 2 — Pn 


O exemplo 3.12 ilustra esse caso. 
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Expansão em frações parciais para A(z) com raízes múltiplas: 
Caso X(z)/z tenha polos múltiplos, por exemplo, um polo duplo em z = pı e um 


polo simples em z = p2, a seguinte expansão pode ser feita: 


X 
(z) — aa > + 012 de a2 . (3.42) 
Z (2-m) 2-pil z—pa 


Os coeficientes a11 e a12 são obtidos da seguinte forma: 


X(z 
aii = E = mA] , (3.43) 
á z=pı 
Z d 2X (2) 
ag = E (6 pı) P = . (3.44) 
No caso mais geral, com k > 2 polos múltiplos em z = pı, 
X(2) a11 012 Mi aik 
See par eF o ee é (3.45) 
z (em) (ep)! (z=p) (z - p1) 
O coeficiente a1; é dado por 
1 ga EX (2) 
01; = = E (6 — pı) a. a . (3.46) 


Tal caso é ilustrado no Exemplo 3.13. 
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Expansão em frações parciais para A(z) com raízes complexas conjugadas: 


O Exemplo 3.14 ilustra um desses casos. 
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O comando iztransf () do Symbolic Math Toolbox pode ser utilizado para encontrar 
a transformada-z inversa. O Exemplo 3.12 pode ser resolvido diretamente no MATLAB® 


da seguinte forma: 


clear ally cles 

syms n Z; hDefine n e z como vars. simbólicas 
X = (z+1)/(z72+0.3*z+0.02); Define X(z) 

disp('X(Z) = '); 

pretty (X); / Forma "bonita" de X(z) 
x=iztrans(X); /0btém a transformada z inversa. 
disp('x[n] = '); 

pretty (x); / Forma "bonita" de x[n]. 


OBS: o termo kroneckerDelta(n, k) na resposta corresponde ao delta de Kronecker, 


Onk, definido como 


que foi utilizado para representar o impulso unitário. 


3.8 Relação entre o plano-s e o plano-z 


Já foi visto neste capítulo como um ponto no plano-s é mapeado no plano-z. Se 
considerarmos apenas a faixa principal da Figura 3.3 indo de —jw,/2 a jws/2 0 caminho 
descrito pelos pontos I > II > III — IV > V no semiplano esquerdo do plano-s é 
mapeado no círculo unitário como ilustrado na Figura 3.6. 

É sabido que sistemas com pares de polos sobre uma linha contínua vertical no 


semiplano esquerdo do plano-s apresentam uma mesma taxa de decaimento (envoltória) 
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Im 


— 00 
V IV Re 


pu /2 


(a) (b) 


Figura 3.6 - Mapeamento da faixa principal do plano-s (a) no plano-z (b). 


na resposta ao degrau. Considere, por exemplo, um dos polos de um sistema de segunda 


ordem subamortecido localizado em s = —o + jwa. Note que 


z = els = eTslcotiwa) — ¿Ta0 giTswa (3.47) 


em que wa = Way 1 — C? é a frequência natural amortecida, wn é a frequência natural, 
Ç o coeficiente de amortecimento e o = Cwn. Com a fixo, ao variar wa, pode-se verificar 
que o módulo de z é fixo e que a fase de z varia, formando uma circunferência no plano- 
z. Portanto, linhas verticais no plano-s são mapeadas em circunferências concêntricas à 
origem no plano-z. A linha sobre o eixo jwa no plano-s é mapeada sobre a circunferência 


unitária em z, como visto na Figura 3.7. 


Alm 


Figura 3.7 — Linhas verticais no plano-s e a representagao no plano-z. 


Sistemas com pares de polos sobre uma mesma linha horizontal no plano-s possuem 
a mesma frequência natural amortecida wg. Em termos da resposta ao degrau para um 
sistema de segunda ordem subamortecido, isso significa o mesmo tempo de pico. 

Considere novamente a relação em (3.47). Com wa constante, ao variar o, verifica-se 


que a fase de z é fixa e que o módulo de z varia, formando uma reta radial no plano- 


68 Controle Digital Aplicado 


z. Assim, linhas horizontais no plano-s representam linhas radiais no plano-z, como 


ilustrado na Figura 3.8. 


Ww, 
plano-s 
w 
> 
Re 
—w 


(a) (b) 


Figura 3.8 — Linhas horizontais no plano-s e a representacáo no plano-z. 


No plano-s, sistemas com pares de polos sobre uma mesma linha radial possuem 
coeficientes de amortecimento ¢ constantes. Em termos da resposta ao degrau para 
sistemas subamortecidos, isso corresponde a um mesmo máximo sobressinal. Note que 


s = —0 + jwa pode ser reescrito como 


E 
JE 


Assim, para Ç constante, ao variar wa positivamente, verifica-se que a fase de z 


Ss = —Wa + jwa. (3.48) 


aumenta, mas o seu módulo decresce. Portanto, linhas radiais no semiplano esquerdo do 
plano plano-s sáo mapeadas em espirais no interior da circunferéncia de raio unitário, 


como ilustrado na Figura 3.9. 


(a) 


Figura 3.9 — Linhas radiais no semiplano esquerdo do plano-s e a representação 


no plano-z. 
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A Figura 3.10 mostra algumas curvas com Ç constante no plano-z para 
0 < wa < 0,5ws, o que corresponde às curvas localizadas na metade superior do 


plano-z. 


= 0 1 Re 
Figura 3.10— Exemplos de curvas com Ç constante no plano-z para 


O < wa < 0,50. 


No plano-s, linhas com Ç constantes são normais a linhas com wn constantes. No 
plano-z, tal propriedade se mantém, ou seja, o mapeamento do plano-s para o plano-z (e 
vice-versa) é um mapeamento conforme?. A Figura 3.11 ilustra linhas com Ç constante e 
wn constante no plano-z. O comando zgrid do MATLAB® pode ser utilizado para esse 
propósito. 

É interessante observar que w,/2 corresponde à maior frequência representada no 


plano-z, o que está de acordo com o teorema da amostragem. 


2Mapeamento conforme entre dois planos complexos é tal que ângulos locais e formas 


infinitesimais são preservadas [Shima e Nakayama 2009]. 
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-1 -08 -06 -04 -0.2 0 0.2 04 06 08 1 Re 


Figura 3.11 — Linhas no plano-z com Ç constante e wn constante na parte superior 


do semiplano esquerdo do plano-s. 


Capitulo 4 


Discretização de Sistemas 


Continuos 


O objetivo deste capítulo é definir uma função de transferência discreta Cp(z) que 
equivalha à função de transferência C(s) de um sistema contínuo. Com isso, pode-se, por 
exemplo, projetar um controlador no domínio-s e converter para o domínio-z para ser 
implementado digitalmente. Serão apresentados quatro métodos distintos e, em seguida, 
a discretização do controlador PID. Por último, será apresentada com mais detalhes a 


aproximação pelo segurador de ordem zero. 


4.1 Mapeamento casado de polos e zeros 


O método do mapeamento casado de polos e zeros (ou casamento polo e zero) consiste 


em mapear diretamente polos e zeros do plano-s para o plano-z. Tal procedimento 


Ts 


considera z = e*** como a transformação entre s e z. O equivalente discreto é obtido 


com o seguinte procedimento: 


1. Todos os polos e zeros finitos no plano-s são mapeados no plano-z como z = ess, 
Por exemplo, polos reais em s = —a são mapeados em z = e “Ts e polos complexos 
ems = —a+ jw são mapeados em z =e OTs gtjoTs 

2. Os zeros em s > oo ou fora da faixa primária são mapeados em z = —1. A razão 
por trás disso é que o ponto z = —1 representa a maior frequência possível da 


função de transferência discreta. Isso geralmente é feito de duas maneiras: 
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(i) Para obter sistemas bipróprios (grau do denominador = grau do numerador), 
todos os zeros em s — oo são mapeados em z = —1. Ou seja, para cada 


zero no infinito, inclui-se um termo (z + 1) no numerador. 


(ii) Para atrasar a resposta do sistema discreto em um período de amostragem, 
então um dos zeros em s — oo é mapeado em z — oo, enquanto que os 
outros são mapeados em z = —1. Com isto, há um zero finito a menos do 
que polos finitos em Cp(z). Assim, tem-se um sistema estritamente próprio 


(grau do denominador > grau do numerador). 


3. O ganho de Cp(z) deve ser ajustado em uma frequência crítica. Normalmente, 
escolhe-se um ponto em baixas frequências, por exemplo C(s)|.-o = Cp(2)|.=1- 


O comando em MATLAB® para transformar uma função de transferência continua 
em uma discreta, com período de amostragem T,, por meio do mapeamento casado de 
polos e zeros, é: C_D = c2d(C,T_s,'matched'). Tal comando utiliza o método 2(ii) para 


mapear os zeros no infinito do sistema contínuo. 


O Exemplo 4.1 aborda este método de discretização. 
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4.2 Equivalente discreto por integração numérica 
Considere o integrador puro dado por 


o= =2, (4.1) 


Assim, ; 
“= / dir, (4.2) 


Para t = nT, tem-se: 
nT 
a(nt,) = / e(r)dr, 
0 
(n—1)Ts nTs 
/ e(T)dr + f e(r)dr, 
0 (m=1) 


s 


área de e(7) 
para (n — 1)T, < T < nT, 


u([n — Ts) + (4.3) 


A área de e(7) no intervalo (n — 1)T, < 7 < nT, pode ser aproximada de três formas 
diferentes, conforme ilustrado na Figura 4.1. 
Utilizando a aproximacáo retangular para frente (Figura 4.1 (a)), pode-se verificar 
que: 
u(nT;) = u([n — 1]T;) + Tse([n — 1]Ts), (4.4) 


a sequéncia obtida é dada por: 


u[n] = u[n — 1] + Tse[n — 1]. (4.5) 
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a nT T O nT T 


área: u([n — 17) área: u([n — 1T) área: u([n — 2) 


s 


(a) (b) (c) 
Figura 4.1— Aproximações para integral: (a) retangular para frente (forward 
rectangular); (b) retangular para trás (backward rectangular); (c) 


trapezoidal (Tustin). 


Aplicando a transformada-z em (4.5), obtém-se 


U(z) = 2 1U(z) + Tx 1 (2), (4.6) 
ou seja, i ou 
E(z) ~i = al” Ani) 


Ao comparar com (4.1) chega-se, portanto, à seguinte relação: 


= il = 
_l zZ 2 t (4.8) 


c= TE, T, 


Utilizando agora a aproximação retangular para trás (Figura 4.1 (b)), pode-se veri- 
ficar que 
u(nT,) = u([n — 1]T,) + Tse(nT;s). (4.9) 


A sequéncia obtida é dada por 
u[n] = u[n — 1] + Ten]. (4.10) 
Aplicando a transformada-z em (4.10), obtém-se 
U(z) =z 'U(z)+T,E(z), (4.11) 
ou seja, 


U(z) Is 
E(z) 1-21 


(4.12) 


A seguinte substituição é utilizada para obtenção do equivalente discreto: 


1 = "+ z—1 
= = : 41 
5 T, zT, (112) 
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Outra regra que pode ser utilizada é a trapezoidal, como mostrado na Figura 4.1 (c). 


Com isso, 


u(nT;) = u([n — 1]T;) + B feln —UTs) + e(nT,)}. (4.14) 
A sequência obtida é dada por 
ufr] = ujn — 1] + E (efn — 1] + et) (4.15) 


Aplicando a transformada-z e separando os termos em U(z) e E(z), obtém-se 


U(z) (1-2) = T Bla) (1+27}), (4.16) 
ou seja, 
U(z) — T,1+27' 
HA  gil=gr eat) 


A aproximação discreta é obtida com a seguinte substituição: 


ret A (4.18) 
As trés equivalentes discretas sáo resumidas na Tabela 4.1. 


Tabela 4.1 — Resumo dos equivalentes discretos. 


Método Aproximação 
z—1 
F d = 
orwar S T, 
z—1 
Backward = 
ackwar S Tz 
2(z-1 
Trapezoidal s= — yew 
s (z+ 1) 


O método trapezoidal é também conhecido como método de Tustin, ou transformação 
bilinear. A transformação bilinear também pode ser obtida ao observar que z = es > 


s = (1/T,) ln(z). A função ln(z) pode ser expandida como 


gd. Ufa MA ifa 11” 
(3) (E) +), (4.19) 
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Logo, 
L ale) 2 fz-1 ,1(z-1 Pal p= A 
s=— In(z) = — 
T T,\z+1 31z+1 5\2 +1 
2 —1 
q ERA (4.20) 
Ts (241) 
sendo que a aproximação considera apenas o termo de primeira ordem. Com isso, 
Cp(z) = C(s)| 2 q. (4.21) 


s=T; (F1) 


Para se ter uma ideia gráfica do mapeamento da região estável do plano-s no plano-z, 
considerando os métodos retangular para frente, retangular para trás e bilinear, pode-se 
aplicar Re{s} < 0 nas relações da Tabela 4.1 [Castrucci, Bittar e Sales 2018]. 

Na regra retangular para frente, tem-se que s = (z — 1)/T.. Assim, como T; > 0, a 
região Re{s} < 0 é mapeada em Re{z} < 1, como ilustrado na Figura 4.2 (a), em que a 
região cinza representa o semiplano esquerdo do plano-s mapeado no domínio-z. Pode- 
se, portanto, concluir que um sistema estável em s pode ser mapeado em um sistema 
instável em z. Com este método, para que um polo estável no plano-s seja mapeado em 
um polo estável no plano-z, deve-se garantir que |z| < 1 = |1 + T,s| < 1. Suponha um 


polo estável qualquer no plano-s, sy = —o + jwa. Assim, 


|1 +T;(—0 + jwa)| < 1, 

|-T,o +1 jTswa)| < 1, 

Teo? + 2T,0+1+T?w?<1, 
20 


T; < ——Gús + 
E 02 + wi 


(4.22) 
Em sistemas de segunda ordem, tem-se o = (Wn, e wa = Wn /(1— (2), em que € é 
o coeficiente de amortecimento e w, a frequência natural. Nesse caso, a relação (4.22) 
pode ser escrita como Ts < x, Por outro lado, para sistemas de primeira ordem, i.e., 
So = —o, a condição resulta em T, < 2/0. 
Para a regra retangular para trás, s = (z — 1)/(Tsz). A variável complexa z será 
representada como z = x + jy. Assim, como T, > 0, a região Re{s} < 0 é mapeada da 


seguinte forma: 


> (e = 3] +y< AE (4.23) 
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Com isso, o semiplano esquerdo do plano-s é mapeado no interior da circunferência 
de raio 1/2, centrada no ponto (0,5; 0), como visto na Figura 4.1(b). Logo, como esse 
método, um polo estável em s é sempre mapeado em um polo estável em z. 

Por fim, para a transformação bilinear, a região Re{s} < 0 é mapeada da seguinte 


forma: 


Toz+1 r+1+3y 
> 2+y<l (4.24) 


2 2-1 si 
Re (mo b<o > nef ZHE) cos P1497) <0 


Logo, o semiplano da esquerda do plano-s é mapeado no círculo unitário do plano-z, 


como ilustrado na Figura 4.2 (c). 


Im Im Im 


(a) (b) (c) 
Figura 4.2 — Mapeamento do semiplano da esquerda plano-s no plano-z para (a) 


retangular para frente; (b) retangular para tras; (c) bilinear. 


A Figura 4.3 ilustra a resposta ao degrau contínua e as versões em tempo discreto 
dos três métodos apresentados nesta seção, considerando o sistema 1/s (integrador). O 
período de amostragem é fixado em T, = 0,2 s. O Exemplo 4.2 traz uma comparação 
entre os métodos apresentados. 

Com o método de Tustin, apesar de toda a região estável do plano-s (semiplano da 
esquerda) ser mapeada dentro de toda a região estável do plano-z (círculo unitário), há 
distorções. Seja wa um ponto no eixo imaginário do plano-s. Nota-se que pontos sobre 
o eixo imaginário do plano-s são mapeados em pontos sobre a circunferência unitária no 


plano-z e vice-versa. Utilizando a transformação bilinear de s = 0 + jw, para z, tem-se 


(4.25) 


Considere wp, tal que 
god = ee (4.26) 
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25 T T T 


Contínuo 
||-- - Retangular para frente E 
--=-- Retangular para trás E 


Figura 4.3 — Resposta ao degrau para o sistema integrador com diferentes mé- 


todos de discretizacáo. 


Ao substituir (4.26) em (4.25), pode-se medir a distorcáo de frequéncia que ocorre 


quando o método de Tustin é utilizado para discretizar uma funcáo de transferéncia, pois 


2 ejuDTs il o 2 ejwpTs/2 (ejupTs/2 = eiuDTs/2) o J 2j sen (wpT,/2) 


JOA T, ejunTa +1 Ty elwoTs/2 (cjooTa/2 y e-jopT?) Ty 2c08 (wpTs/2) ' 
(4.27) 
ou seja, 
WA = y tem (wpTs/2). (4.28) 


Se tan (upT;/2) = wpT;/2, ou seja, quando wpT; é pequeno (altas frequências de 
amostragem), wa = Wp e, portanto, a distorção é minimizada. Uma forma de compensar 
as distorções em uma dada frequência we, geralmente a frequência de corte do filtro, é 
utilizar o procedimento de prewarping na frequência we. A ideia é garantir que, em we, 
a função de transferência discreta tenha as mesmas características da função em tempo 


contínuo correspondente. Note que isso pode ser feito se 


We (z-1) 
= 3 4.29 
= tan(weT,/2) (2 + 1) (aae) 
Portanto, com prewarping, tem-se a seguinte equivalência: 
Cp(z) = C(s)|,-__ ee qm. (4.30) 
tan(weTs/2) (+1) 
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O comando em MATLAB® para a transformação bilinear com prewarping em we é: 


C_D = c2d(C,T_s,'prewarp',wc), como apresentado no Exemplo 4.3. 
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Resposta ao Degrau Unitário 


aa: 


0.25 T 


Contínuo 
- O - Retangular para frente 


--#-- Retangular para trás 


0 1 2 3 4 
t(s), nT, 


Figura 4.4— Resposta ao degrau do Exemplo 4.2 com diferentes métodos de 


discretização. 
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o 


10! 10° 10! 
Freq. (rad/s) 


X 6.86649 
Y -147.523 


-200 
10! 10° 10! 


Freq. (rad/s) 


Figura 4.5 — Gráficos de resposta em frequência do Exemplo 4.3. 


Algumas observações sobre os métodos de discretização: 


e Quanto menor o período de amostragem, melhor é a aproximação do sistema em 
tempo contínuo original pelo sistema em tempo discreto. Mas cuidado com a dimi- 
nuição exagerada de T,. Por exemplo, com a equivalência z = es, para T, > 0, 
z > 1. Próximo do ponto z = 1, as linhas de coeficientes de amortecimento cons- 


tante são muito próximas. Se a precisão computacional não for adequada, podem 


ocorrer discrepâncias em relação às especificações de projeto. 


e Para usar o método retangular para frente, deve-se sempre verificar se a frequência 


de amostragem não vai gerar polos instáveis. 


e Se a frequência de amostragem for próxima da taxa de Nyquist, recomenda-se 


utilizar métodos com menor distorção, tais como Tustin ou mapeamento casado 


polo-zero. 


e O método de Tustin não é adequado para aproximação de derivadas puras, por 


exemplo, a ação derivativa de um controlador PID, pois isso gera uma resposta 


oscilatória devido ao polo em z = —1. 


e Com Tustin e com o mapeamento casado polo-zero apresentado em 2(i), as funções 
de transferência discretas serão bipróprias. Se isso for indesejável, pode-se então 


utilizar a versão estritamente própria do casamento polo zero apresentada em 2(ii). 
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4.3 Discretizacgao de controladores PID 


O PID basico, continuo, é dado por 


u(t) = Kp (eo + F e(T)dr + 120) ' (4.31) 


em que Ke, T; e Ty representam, respectivamente, o ganho proporcional, o tempo inte- 
grativo (ou reset time) e o tempo derivativo. 


A ação de controle pode ser dividida nas parcelas 


up(t) = Kp e(t), (4.32) 
sef 

ur(t) = Ff e(T) dr, (4.33) 

up(t)— Kets = (4.34) 


Uma descrição mais detalhada deste tipo de controlador é apresentada no Apêndice 
A. A discretização da parte proporcional é dada por up[n] = Kp e[n]. Ao considerar a 


aproximação retangular para trás nas parcelas integrativa e derivativa, chega-se em 


lie En elk] = urin] = usin — 1] + E Tej, (4.35) 
k=0 
up|n] = oe (e[n] — efn — 1]). (4.36) 


Assim, a ação de controle corresponde à soma das três parcelas, ou seja, 
un] = up[n] + ur[n] + upln]. (4.37) 


Esta formulação é conhecida na literatura como PID posicional, tendo como vantagem 


o fato de as parcelas proporcional, integrativa e derivativa serem obtidas separadamente. 


Se o método de Tustin for utilizado para a parcela integrativa, tem-se que 


KpT, 
OT; 


urin] = ur[n — 1] + (e[n] + e[n — 1]). (4.38) 


Como pode ser visto no Apêndice A, a função de transferência do controle PID 


realizável é dada por 


U(s) o 1 Tps 
= Kp (1 et DIN) x :) i (4.39) 
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em que um polo em —N/Ty é adicionado à parcela derivativa. Neste caso, a função de 


transferência da parcela derivativa isolada é dada por 


Up(s) Tps 


=K: å 4.40 
E(s) P(Tp/N)s +1 (a 
Utilizando a técnica de discretização retangular para trás, chega-se em 
U KpNT —1 
plz) ni £ (4.41) 


E(z) (Tp + NTs) (z — ation) 


Para Tp pequeno, o que ocorre frequentemente, o polo ficará situado próximo de 
z=0. A equação de diferenças da parcela derivativa é dada por 


Tp KpNTp 


up[n] = (Tp + NT) “Pr ] (Lo + NT) (e[n] — e[n — 1]). (4.42) 


Como comentado no Apêndice A, para amenizar o efeito kick derivativo, a parcela 


derivativa pode atuar diretamente na realimentação de saída, o que resulta em 


1 Tps 
= Kp | 1+ — J] E K Y sj: 4.4 
U(s) = Kp (147) BO) - Ke pro (4.43) 
Com isso, a seguinte equacáo de diferencas é obtida: 
Tp KpNTp 


Com relação à implementação do controlador digital, uma forma simples de anti- 
windup consiste em “congelar” a ação integrativa quando há saturação, conforme o pseu- 


docódigo a seguir |. Assume-se que a saturação do atuador é conhecida e igual a +sat. 


%PID posicional com anti-windup (v.1) 
if (u[n-1] >= sat || uln-1] <= -sat) 
e_i[n]=0; 
else 
e_i[n]=r[n]-y[nm]; 
end 
elal = rinl-y[al; 
u_P[n] = K_P*e[n]; 
u_I[n] = u_I[n-1] + (K_P*T_s/T_I)*e_i[n]; %Ex: backward 
u_D[n] T_D/(T_D+N*T_s)x*u_D[n-1]-(K_Px*N*T_D)/(T_D+N*T_s)*(y[n]-y[n-1]); 
u[n]=u_P[n]+u_I[n]+u_D[n]; 


1Os pseudocódigos aqui apresentados estão em uma linguagem genérica — uma com- 
binação de linguagem C com MATLAB®. 
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Alternativamente, pode-se ter uma versão de anti-windup que consiste no equivalente 


discreto do sistema da Figura A.5 do Apêndice A, como mostrado a seguir: 


“PID posicional com anti-windup (v.2) 
a = Ts/T_t; 
if (u[n-1] >= sat) 
eu = u[n-1] - sat; %e_u: diferença do sinal de controle antes e 


depois da sat. 


elseif (u[n-1] <= - sat) 
e_u = u[n-1] + sat; 
else 
e_u = 0; 
end 


e[n] = r[n]-y[n]; 

u_P[n] = K_P*e[n]; 

u I[n] = u_I[n-1] + (K_P*T_s/T_I)*e[n] - axe u; %Backward 

u_D[n] = T_D/(T_D+Nx*T_s)*u_D[n-1]-(K_Px*N*T_D)/(T_D+N*T_s)*(y[n]-y[n-11); 
u[n]=u_P [n]+u_1[n]+u_D[n]; 


Outra forma de PID digital é denominada PID incremental ou PID de velocidade. 
Tal forma é obtida tomando-se a diferenca do PID de posicáo no instante n e no instante 
(n — 1), ou seja, 

Auln] = ujn] — u[n — 1] = Aup[n] + Aur [n] + Aup|[n]. (4.45) 

Assim, 

ujn] = u[n — 1] + Aup[n] + Auz[n] + Aup[n]. (4.46) 


Assumindo a aproximacáo retangular para trás nas parcelas integrativa e derivativa, 


os termos incrementais sáo dados por 


Aupln] = up[n] — up[n — 1] = Kp(e[n] — eln — 1), (4.47) 


Aub) = ut — wif — 1] = EE eu - EE Y a = E, (448) 
k=0 k=0 


e, para a derivada ideal, 


Aup[n] = upln]-upln—1]= 
ee Keln] — eln — 1]) — (eln — 1] — e[n — 2] = 
Em (dal e dea a. (4.49) 
Se o método de Tustin for utilizado para a parcela integrativa, chega-se em 
E = PPE pep oly athe (4.50) 
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Se a derivada da saída (com sinal trocado) for considerada ao invés da derivada do 
erro, tem-se 


KpTp 
Ts 


Aupln] = (y[n] — 2y[n — 1] + y[n — 2]). (4.51) 


Ainda, se for considerada a forma realizável com filtro na parcela derivativa e apro- 


ximação retangular para trás, tem-se que 


an S g OW Aup|n — 1] 
KpNTp 
(Tp + NT) lr] in — 1 + vin 2). (4.52) 


A forma incremental é somente utilizada se a parcela integral estiver presente, ou 
seja, nao é diretamente valida para controladores P e PD ideal. A vantagem deste 
método é que, a cada passo de cálculo, apenas valores incrementais são calculados para 
as parcelas do controlador, o que pode reduzir problemas com precisão numérica em 
ponto flutuante. Na hipótese de falha em alguma iteração do algoritmo, ao retornar 
para a condição normal de operação, a ação de controle ficará com o último valor válido. 
A forma incremental também favorece a implantação de transferência suave (bumpless) 
entre modos de operação manual e automático ou quando parâmetros do controlador 
necessitam ser ajustados online. O anti-windup na forma incremental pode ser aplicado 


como: 


4PI incremental com anti-windup 

e[n] = r[nl-y[n]; 

Du P = K_P*(e[n]-e[n-1]); 

Du I=(K PxT s/(2xT 1))*(e[n] + e[n-1]); %Tustin 
ula] = uln-1] + Du P + Du I; 

if (uln] >= sat) 


u[n] = sat; 

elseif (uln] <= - sat) 
uln] = -sat; 

end 


O Exemplo 4.4 ilustra a discretização de controladores PID de várias formas diferen- 
tes. 
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æ Exemplo 4.4: Considere o diagrama de simulação da Figura 4.6, que consiste no 
controle de velocidade de um motor de corrente contínua. Para tal sistema, foi projetado 
um controlador PID com os seguintes parámetros: Kp = 3, Tr = 0,5, Tp = 0,3. O 
atuador é limitado em +30V. Programe o código da Matlab Function do controlador 


digital considerando: 


a) PID posicional, com discretização retangular para trás nos termos I e D, sem 


anti-windup em I, com derivada da saída e sem polo adicional em D. 


b) PID posicional, com discretização retangular para trás nos termos I e D, com 


anti-windup em I, com derivada da saída e sem polo adicional em D. 


c) PID posicional, com discretização retangular para trás nos termos I e D, com 
anti-windup em I, com derivada da saída e com polo adicional em D, assumindo 
N =3. Para o anti-windup, utilize a versão discreta do diagrama apresentado no 
Apêndice A, Figura A.5, com T; = yT¡Tp. 


d) PID incremental, com discretização trapezoidal em I e retangular para trás em 
D, com anti-windup em I, com derivada da saída e com polo adicional em D, 


assumindo N = 3. 
Em todos os casos, considere: 


período de amostragem Ts = 0, 02s; 

duração da simulação igual a 60s; 

sinal de entrada degrau de amplitude igual a 2; 

entrada distúrbio tipo pulso retangular de amplitude 20, de t = 15s a t = 35s; 
ruído de medida com média nula e variância igual a 0,01. 


Solução: o exemplo foi resolvido diretamente no MATLAB/ Simulink®, com os diagramas 
da Figura 4.7. O script principal e o código das Matlab Functios são apresentados a seguir. 


Os resultados são mostrados na Figura 4.8. 


clear all; close all; clc; 

rng shuffle 

K_P = 3; T_I = 0.5; T_D = 0.3; N= 3; Parámetros PID 
t_step = 1; %Tempo de aplicação do degrau 

veloc = 2; %Velocidade de referência (rad/s) 

t. disturb 1 = 15; %Tempo de entrada do distúrbio casado 
t_disturb_2 = 35; / Tempo de saída do distúrbio casado 
disturb = 20; Amplitude do pulso de distúrbio 

var ruido = 0.01; /Variáncia do ruído de medida 


Ts = 0.02; /Período de Amostragem 
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rn] 


Figura 4.6 — Sistema de controle do Exemplo 4.4. 
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Figura 4.7 — Diagramas de simulação do Exemplo 4.4. 
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Figura 4.8 — Resposta do Exemplo 4.4. Na Figura (a) fica evidente o efeito 


nocivo do windup do integrador, o que é compensado nas respostas 


das Figuras (b), (c) e (d). Verifica-se também nas respostas (c) e 


(d) que o polo adicional na ação derivativa resulta em um esforço de 


controle menos ruidoso. 
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4.4 Aproximação por segurador de ordem zero 


Até este ponto foram apresentados métodos que resultam em sistemas discretos equi- 
valentes ao sistema contínuo original. Essa ideia permite obter controladores digitais a 
partir de um controlador contínuo. 

Porém, outra forma de projeto consiste em discretizar a planta e projetar o contro- 
lador discreto, sem passar pelo projeto contínuo, o que será apresentado em capítulos 
subsequentes. Esta aproximação é utilizada quando se deseja obter uma representação 
discreta de um sistema incluindo o efeito do segurador de ordem zero e da amostragem, 


conforme apresentado na Figura 4.9. 


Processo y (n T) 


“eo [| MO ao |? 


Go(2) 


Figura 4.9 — Equivalência do subsistema ZOH + processo + A/D. 


O equivalente discreto de G(s) com ZOH pode ser obtido como 
— p—Ts § 
Got) = 2 (Soto) = 2 (SU) -g (eme, (4.53) 


-T:s é exatamente um atraso de um período de amostragem, verifica-se que 


zien Se) =z (SU, (4.54) 


Gp(z) = (9210), (4.55) 


Como e 


Portanto, 


Considere que a resposta ao degrau do sistema em tempo discreto seja coincidente 


com a do sistema em tempo contínuo nos instantes de amostragem, ou seja, 


ls GOHI 


cat 5-2 { aes \ (4.57) 


(4.56) 


Assim, 
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ou ainda RE { G(s) ) | (4.58) 


Ss 


Por essa razão, a aproximação por ZOH também é conhecida com invariáncia ao 
degrau. 

Para realizar um projeto de controle diretamente no plano-z a partir de uma planta 
contínua, deve-se, inicialmente, obter o equivalente discreto da planta pelo método 
ZOH. Atencáo especial deve ser dada quando a ordem relativa do sistema (a dife- 
renca entre o número de polos finitos e o número de zeros finitos) é maior ou igual 
a dois. Nesses casos, se O período de amostragem for suficientemente pequeno, o sis- 
tema em tempo discreto pode apresentar zeros de fase não minima, mesmo que o 
sistema em tempo contínuo seja de fase mínima [Astrém, Hagander e Sternby 1980], 
[Hagiwara, Yuasa e Araki 1992]. Para técnicas de projeto que exigem sistemas de fase 
minima, isso é um problema. 

Neste caso, pode-se utilizar outro método de discretização, como o da invariância 
ao impulso (Seção 3.6). Se assim for feito, o efeito do atraso do ZOH não é inserido no 
modelo em tempo discreto, o que pode resultar em especificações de desempenho não 
atendidas no projeto do controlador. Tente, nesse caso, utilizar um período de amostra- 
gem suficientemente pequeno para que o efeito do atraso de T,/2 não seja relevante. 


O Exemplo 4.5 mostra o cálculo de um sistema discreto considerando o efeito do 
ZOH. 
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Capitulo 5 


Analise de Sistemas de Controle 


em Tempo Discreto 


Neste capitulo é feita uma análise de sistemas de controle digitais no plano-z. Tal 


análise servirá de suporte para o projeto de controladores digitais. 


5.1 Do plano-s para o plano-z 


No Capítulo 3 as seguintes relações entre o plano-s e o plano-z foram apresentadas: 


e O semiplano esquerdo do plano-s é mapeado no interior do círculo unitário no 


plano-z. 


e Linhas verticais no plano-s com o = Cw, constante, que estão relacionadas com o 
tempo de assentamento da resposta transitória, são mapeadas em circunferências 


concêntricas à origem no plano-z. 


e Linhas horizontais no plano-s com wg constante, que estão relacionadas com o 


tempo de pico da resposta transitória, são mapeadas em linhas radiais no plano-z. 


e Linhas radiais no plano-s com ¢ constante, que estão relacionadas com o sobressi- 


nal da resposta transitória, são mapeadas em espirais no plano-z. 


No plano-s, linhas com ¢ constantes são normais a linhas com w, constantes. No 
plano-z, tal propriedade se mantém. A relação entre a posição de polos dominantes de 
malha fechada de um sistema no domínio-z e a resposta transitória está esquematizada 


na Figura 5.1. 
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Pray É ; 


Figura 5.1 — Exemplos de respostas impulsivas discretas de acordo com a posi- 


ção dos polos no plano-z, considerando apenas o semicírculo unitário 
com parte imaginária positiva. Assumiu-se que os sistemas não pos- 


suem zeros finitos. 


O Exemplo 5.1 apresenta um procedimento para obter a região do plano-z a partir 


de uma região definida com especificações no plano-s. 


£ Exemplo 5.1: Indique no plano-s e no plano-z a região aceitável para localização dos 
polos de malha fechada de um sistema com Ç > 0,5, wa < 2,5 rad/s e wn > 1,0. 
Considere período de amostragem T, = 0, 25 s. 
Solução: como 
z = Ts = g ConTs etiwaTs 
tem-se que: 
ie Ges. a, os ce Pesos, 
La = samba 91 LE 20 => 0,00 € Ze EL =D SS Ze SS”. 
ou seja, Cw, > 1,0 corresponde no plano-z ao interior do círculo de raio 0,7788, ao 
passo que wa < 2,5 corresponde ao setor circular de —35, 8° a 35,8%. A linha Ç = 0,5 é 
mapeada em um espiral no plano-z, conforme a equacáo (3.48). Isso também pode ser 
feito com o comando zgrid do MATLAB®. O mapeamento é ilustrado na Figura 5.2, 


construída a partir do seguinte script: 
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plano — z 


-0,8 -0,6 -0,4-0,2 0 0,2 0,4 0,6 08 1 
(a) (b) 


Figura 5.2 — Mapeamento s > z do Exemplo 5.1. 
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5.2 Análise de estabilidade 


Considere o sistema em malha fechada representado na Figura 5.3. 


R(2) tm Ele) 


Figura 5.3 — Sistema em tempo discreto em malha fechada. 


A função de transferência de malha aberta é dada por 
F(z) = G(2)H(2), (5.1) 


e a de malha fechada por 


YO. ee) Ge) 
R(z) 1+F(2) 14+G(z)H(z) 


Gur(z)= (5.2) 


A estabilidade desse sistema é determinada pela localização dos polos de malha fe- 


chada, obtidos pela solução da seguinte equação característica: 
P(@) =1+F (2) =0, (5.3) 


O sistema é absolutamente estável se os polos de malha fechada possuírem raio menor 
do que a unidade. 

Caso nao se conheca explicitamente as raízes de P(z), pode-se utilizar o critério 
de Jury para determinar a estabilidade de um sistema em tempo discreto. Detalhes 
sobre esse critério sao encontrados em referéncias clássicas de controle digital, tais como 
[Ogata 1995, Kuo 1992, Castrucci, Bittar e Sales 2018]. Em especial, em [Kuo 1992] é 
citado o artigo de E. I. Jury and J. Blanchard (1961) em que o método é proposto. 


5.3 Análise de erro em regime estacionário 


Alterações na entrada de referência causaráo erros inevitáveis em regime transitório e, 
possivelmente, erros estacionários. Nesta seção será estudado o tipo de erro estacionário 
causado pela incapacidade de um sistema em tempo discreto seguir determinados tipos 


de sinal de entrada. 
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Sistemas de controle em tempo discreto podem ser classificados de acordo com o 
número de polos de malha aberta em z = 1. Suponha que um sistema possua a seguinte 


função de transferência em malha aberta: 


1º Biz) 
F(z) = +, 5.4 
(z) == DN A(z) (5.4) 
onde as não possui nem polo nem zero em z = 1. Tal sistema é classificado como tipo 
0 se N = 0, tipo 1 se N = 1, tipo 2 se N = 2, e assim por diante. O tipo de sistema está 
relacionado com o erro em regime estacionário para uma dada entrada. 


Considere novamente o sistema em tempo discreto da Figura 5.3. O sinal de erro é 


dado por 
E(z) = R(z) — F(z)E(z). (5.5) 
Logo, i 
E = —— la 5 
(= Aro (5.6) 
Aplicando o teorema do valor final, tem-se 
1 
_ p q _ wil 
Cn dim, e(nTs) = lim [a z ILF + FG) Rta) 5 (5.7) 
O erro estático de posição é definido em relação à entrada degrau unitário 
Riz) = =. ou seja, 
1 Í 
ash a E A 5.8 
A tim [e i POA] di 
que é equivalente a i 
Ess = lim IFF) (5.9) 


Define-se Kp = lim Ma) = lim I N ae como a constante de erro estático de 
2> 2> 


posigao. Logo, 
1 


Cas = 1+K, 


Note que o erro estático de posição se torna zero se Kp — 00, o que requer que F(z) 


(5.10) 


possua um polo (ou mais) em z = 1 (seja pelo menos tipo 1). 
= 
Para entrada rampa unitária, R(z) = =p» o erro em regime estacionário, defi- 


nido como erro estático de velocidade, é dado por 


1 Tae 
ss = li lag" 5 f mal 
4 = lia [Ue TTF (i —z-1) o 
que é equivalente a = 
€ss = lim - : (5:12) 


=" (1-2DFG) 
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a! 1 Biz) 
-2 Gop ae) 


T como a constante de erro 


Define-se K, = lim UE = lim 
251 s 251 


estático de velocidade. Logo, 


y= x (5.13) 

Note que erro estático de velocidade se torna zero se K, — 00, o que requer que F(z) 
possua pelo menos dois polos em z = 1 (seja pelo menos tipo 2). 

O erro estático de aceleração é definido em função da entrada parábola unitária 


2 = tas = 
R(z) = Eu. de maneira que 


il mt e 


= fi =1 14 
C= a le IF FO 2(1-2z71)} |’ ii 
que, por sua vez, é equivalente a 
2 
s 
w= 1 PF) a 
an (1-2 TR | O Pot» 38 
Similarmente, define-se Ka = lim =m ^ = lim como a 
251 E 251 Es 
constante de erro estático de aceleracáo. Desta forma, 
1 
Ess = E (5.16) 
a 


Note que o erro estático de aceleração se torna zero se Ka — 00, o que requer que 
F(z) possua pelo menos três polos em z = 1 (seja pelo menos tipo 3). A Tabela 5.1 


relaciona o tipo de sistema com o erro em regime estacionário. 


Tabela 5.1 — Sistema de controle com realimentação unitária. 


ess Posição ess Velocidade ess Aceleração 


: 1 
Tipo 0 E, 00 00 
Tipo 1 0 x 00 
Tipo 2 0 0 = 


5.4 Lugar geométrico das raízes 
Em sistemas de tempo discreto, a equação característica pode ser escrita como: 


14 F(z) =0 > F(z) =-1. (5.17) 
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Verifica-se que, no caso de sistemas de tempo discreto, as condições necessárias para 
que um dado ponto no plano-z esteja sobre o lugar geométrico das raízes (seja um polo 


de malha fechada) são semelhantes ao caso de sistemas contínuos, ou seja, 
Condição de módulo: |F(z)| = 1, (5.18) 


Condição de fase : ZF(z) = +180º(2k + 1), k=0,1,2,.... (5.19) 


Para a construção do lugar geométrico das raízes (LGR) de sistemas discretos utili- 
zando o MATLAB®, o comando rlocus é utilizado da mesma forma que em sistemas 
de tempo contínuo. O Exemplo 5.2 ilustra o processo de obtenção do LGR com au- 
xílio do MATLAB® e apresenta uma análise de estabilidade em função do período de 


amostragem e do ganho em malha aberta. 
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ZOH Processo 


Figura 5.4 — Sistema de controle em tempo discreto do Exemplo 5.2. 
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Figura 5.5 — LGR do Exemplo 5.2 para (a) Ts = 0,2 s e (b) Ts = 1,0 s. 


Particularmente, no Exemplo 5.2, verificou-se que o ganho K critico para levar o 
sistema ao limiar de estabilidade torna-se maior conforme o período de amostragem é 
reduzido. 

O período de amostragem tem relação direta com a resposta transitória e a estabili- 
dade do sistema. 

O Exemplo 5.3 mostra um caso particular da influência de T, na estabilidade. 
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Figura 5.6 — Sistema de controle em tempo discreto do Exemplo 5.3. 


5.5 Resposta em frequência 


Em regime permanente, a resposta em frequência G(z) pode ser calculada substitu- 
indo-se z = eivTs. Da mesma forma que em sistemas LIT de tempo contínuo, pode-se 
mostrar que a resposta em regime estacionário de um sistema LIT discreto para uma 


entrada r(nT,) = Asen(nwT.) é dada por 


Yss(nT;) = A |G(e%7*) sen | nwT, + ZG(e?*T+) |. (5.20) 
— e?” — dl 
M $ 
O Exemplo 5.4 apresenta a obtencáo da resposta em frequéncia de um sistema LIT 
discreto. 
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A forma gráfica mais tradicional de se obter a resposta em frequência de um sistema 
LIT é por meio de seu diagrama de Bode, que é dividido em dois gráficos: um com a 
resposta de ganho em decibéis (dB) e outro com a resposta de fase em graus, ambos em 
função da frequência angular w em escala logarítmica de década. Assim como para siste- 
mas LIT em tempo contínuo, o diagrama de Bode de uma função de transferência discreta 


pode ser obtido no MATLAB® utilizando-se o comando bode, conforme apresentado no 


Exemplo 5.5. 
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Bode Diagram 
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Figura 5.7 — Diagramas de Bode do Exemplo 5.5. 


Pode-se observar que as curvas para os sistemas discretos se aproximam da curva do 
sistema contínuo para baixas frequências e diferem substancialmente da resposta contínua 
para valores próximos de w = ws/2 = 7/T;. Note que os gráficos não tendem a curvas 


assintóticas como no caso contínuo. 


5.5.1 Margem de ganho e margem de fase 


A margem de ganho é definida como a mudança no valor do ganho de malha aberta 


no ponto com fase de — 180º necessária para tornar instável o sistema a malha fechada. 


Em outras palavras, é o recíproco de |G(eivT=) na frequência wı em que o ângulo é 
— 180º, ou seja, 
1 
MG = ———~.. 5.21 
(Gert) a 


Quando expressa em dB, tem-se 


MG = 20 logy, 


dB = —20log9|G(e?"7*) 


1 
- B. ¿22 
IGT) s sii 
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Já a margem de fase é definida como a mudança no valor de fase de malha aberta 
no ponto com ganho unitário necessária para tornar instável o sistema a malha fechada. 
Em outras palavras, é o atraso de fase adicional, na frequência de cruzamento de ganho, 


necessário para que o sistema atinja o limiar de instabilidade. Matematicamente, 
MF = 180º + 4, (5.23) 


onde q = ZG(eivcTs) é a fase da função de transferência de malha aberta na frequência 


de cruzamento de ganho wg. 


5.5.2 O plano-w 


Como frequências no plano-s são mapeadas no plano-z da forma z = ei“Ts, as pro- 
priedades assintóticas do diagrama de Bode verificadas no plano-s não se estendem para 
o plano-z, como visto no Exemplo 5.5. Para superar tais dificuldades na análise em 
frequência de sistemas discretos, o plano-z pode ser mapeado no plano-w. Tal processo 


é comumente denominado transformada-w, que também é bilinear, sendo definida como 


1+ (T;/2)w 
Te A .24 
“2 T-(T./2)w’ (a2 
onde T, é o período de amostragem. A relação inversa é dada por 
2 2-1 
= — 5 (2 
w Tze (5.25) 


O plano-w é representado por uma frequência fictícia w = jv. É interessante notar 
que, com a transformada-z, a faixa principal do plano-s é mapeada no interior do círculo 
unitário do plano-z. Com a transformada-w, o interior do círculo unitário é mapeado em 
todo o semiplano da esquerda do plano-w. A Figura 5.8 ilustra estes mapeamentos. 

A diferença fundamental entre o plano-s e o plano-w é que a faixa de frequências no 
plano-s de w = —w,/2 aw = ws/2 é estendida de v = —oo0 a v = œ no plano-w. A 
frequência de Nyquist w = w,/2 é mapeada em y = oo, portanto não pode haver qualquer 
dinâmica significativa próxima ou acima da frequência de Nyquist. 

Uma função de transferência G(z) é transformada em G(w) pela transformada-w e 
tratada da mesma forma que uma função de transferência convencional em s. Com isso, 
técnicas convencionais de resposta em frequência podem ser empregadas no plano-w para 
o projeto de sistemas em tempo discreto, fazendo-se w = jv. O detalhe é que, devido à 


transformação, a função de transferência é de fase não mínima. As frequências v e w se 
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Figura 5.8 — Mapeamentos s > z e z > wW. 


relacionam da seguinte forma: 


22-1 _ Best 1 


A = iy = — = — > 
w=jv Jj E 2+1 ¿—etuTs Ta ejiwTs +1 
2 ejwTs/2 = eTivTs/2 


DE a 
= T, GM ear T, tan(wTs/2). (5.26) 


w] 


Com isso, observe que G(jw) pode ser convertida em G(jv) fazendo-se 
w = 7, tan! (vT,/2). Para wT; pequeno, G(s) e G(w) se aproximam. O Exemplo 
5.6 ilustra as respostas em frequência de um dado sistema nos planos s e w. 
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Figura 5.9 — Sistema do Exemplo 5.6. 
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Bode Diagram 


0 T 
do -10 F 
e, 
[0) 
2 201 [—-G(s) 
© | |. G(w), T, = 0.2 
= 01 |... G(w), T, = 0.02 


i 


Phase (deg) 


Frequency (rad/s) 


Figura 5.10 — Diagrama de Bode de G(jv) e G(jw) do Exemplo 5.6. Aqui 


assumiu-se que tanto w quanto y estão com unidades em rad/s. 


Capitulo 6 


Projeto de Controladores Digitais 


Classicos 


Neste capitulo, inicialmente, um controlador digital é obtido pela discretização de 
um controlador projetado em tempo continuo, enfatizando o efeito do atraso devido a 
discretização. Em seguida, alguns exemplos de projeto de sistemas de controle digitais 
são apresentados diretamente no plano-z, considerando técnicas via LGR e resposta em 


frequência. 


6.1 Projeto e discretização de controladores em 


tempo contínuo 


Em muitos casos, controladores digitais são obtidos diretamente pela discretização de 
controladores projetados por técnicas tradicionais em tempo contínuo. Quando a frequên- 
cia de amostragem é relativamente alta, o desempenho do sistema em malha fechada não 
é afetado. No entanto, em outros casos em que a frequência de amostragem não é muito 
mais alta do que a banda passante do sistema, pode-se ter perdas de desempenho. Tal 


aspecto é enfatizado a seguir. 


6.1.1 Efeito da amostragem e do segurador de ordem zero 


O processo de amostragem e o segurador de ordem zero introduzem um atraso na 


resposta do sistema. Se tal atraso for considerável em relação às maiores constantes de 
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tempo do sistema, o desempenho pode ser comprometido. Como já visto, para o ZOH 


tem-se 
1—e78?s 
ZOH(s) = ————. (6.1) 
s 
O termo e~*7* pode ser escrito em uma forma racional utilizando-se a aproximação 


de Padé de primeira ordem, tal que 


E y 1 — sT,/2 


z ———. 6.2 
1+ sT,/2 (2) 


e 
Obviamente, aproximações de maiores ordens são melhores, mas resultam em termos 
mais complexos na função de transferência equivalente, o que dificulta o projeto do 


controlador. Assim, 


1 2 -— sT, 2 
ZOH(s) = 1 = i 6.3 

(s) s ( eE) s+2/T, di 
Para que o ganho em baixas frequências seja unitário, utiliza-se a seguinte aproxi- 


mação [Castrucci, Bittar e Sales 2018]: 


2/T, 


(6.4) 


Com isso, o controlador continuo pode ser projetado conforme o diagrama da Figura 
6.1. 


Figura 6.1 — Sistema de controle em malha fechada com aproximação de primeira 
ordem para ZOH(s). 


Segundo [Franklin, Powell e Workman 2006], o efeito do ZOH pode ser desprezado 
se a frequéncia de amostragem for maior do que 30 vezes a banda passante do sistema. 
Para frequências de amostragem baixas, o efeito é considerável. 

O Exemplo 6.1 apresenta um projeto de controlador no plano-s e analisa o impacto 


de considerar ou não o efeito do atraso do ZOH. 
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Resposta ao Degrau Unitário 


Resposta com Ci (s) 
— Resposta com Ci (z) 
- - - Resposta com C(z) 


3 
t (s) 


Figura 6.2 — Respostas para o sistema compensado do Exemplo 6.1. 
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6.2 Discretizacao da planta e projeto no plano-z 


Nesta seção é apresentada uma motivação para projeto diretamente em tempo dis- 
creto. Para isso, o Exemplo 6.1 será tomado como base. O equivalente discreto da planta 


do exemplo anterior com ZOH é dado por 


Z {ZOH(s)G(s)} = (1-2) Z (aus! 


A mesma metodologia de projeto por alocação de polos do Exemplo 6.1 é considerada 
no Exemplo 6.2, mas agora diretamente no plano-z. Para isso, as especificações da 


resposta transitória no plano-s também precisam ser mapeadas no plano-z a partir da 
sTo 


relação z = e 
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6.3 Projeto pelo LGR 


Considerando, inicialmente, que o traçado do LGR já passa sobre os polos desejados 
de malha fechada, o projeto consistirá apenas em um ajuste de ganho. O Exemplo 6.3 


ilustra esse caso. 
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6.1 - Controlador em tempo discreto, projetado 
em tempo contínuo com efeito do ZOH 


6.1 - Controlador em tempo contínuo 


Data Store Data Store 
Memory2 Memory3 


To Workspace6 
num(s) 


den(s) 
Zero-Order Gi 
Hold3 


Zero-Order 
Hold5 


6.2 - Controlador em tempo discreto, projetado 
em tempo discreto 


To Workspace1 


To Workspace2 


UH To Workspace 
Step 


Data Store Data Store 
Memory Memory1 


To 4 | 


Zero-Order 
Hold4 


To Workspace5 


6.1 - Controlador em tempo discreto, projetado 
em tempo contínuo sem efeito do ZOH 


Data Store Data Store 


Memory4 Memory5 To Workspace8 


To Workspace4 


7 Zero-Order = To Workspace7 
zam ore To Workspace3 Hold? Hold6 
Zero-Order 
“oie Ho 


Figura 6.3 — Diagramas de simulação dos dois exemplos anteriores. 


ia Resposta ao Degrau Unitário 13 


Acáo de Controle 


u(nT; ) 


Figura 6.4 — Respostas para o sistema compensado dos dois exemplos anteriores. 
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N K(z +0,8) 
A A | 


Figura 6.5 — Sistema de controle do Exemplo 6.3. 
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System: G 
Root Locus Root Locus | Gain: 0.0722 
2 r r y 0.4 y T Pole: 0.714 + 0.219) 
07 Damping: 0.7 
0.3 ` Overshoot (%): 4.61 
Frequency (rad/s): 0.417 
e—a 
0.2 F | 
£ 2 01 
< < 
2 a 
fo! q 0 
[= [= 
© © 
[o] [o] 
E. E -01 
-0.2 + 
-0.3 | 1 
pa — 04 / 
4 -3 -2 -1 0 1 0 0.2 0.4 0.6 0.8 1 
Real Axis Real Axis 


Figura 6.6 — Exemplo 6.3: lugar das raízes de G(z) e gráfico ampliado com a 


solução. 


6.3.1 Compensador por avanço de fase 


Um compensador por avanço de fase discreto pode ser escrito como 
z-a 

C(z) = K.—=, 

( ) c O ms B 


Tal compensador é comumente utilizado para melhorar as características da resposta 


-1<B<a<l. (6.5) 


transitória. Um procedimento (não único) de projeto é o seguinte: 
1. Escolha a localização do polo de malha fechada do sistema, zo, conforme a espe- 
cificação de resposta transitória. 


2. O polo e o zero do compensador devem ser escolhidos tais que a condição de fase 
do LGR seja satisfeita em z = zo. Há infinitas formas de resolver o problema. 


Uma escolha consiste em: 


e O zero do compensador é escolhido para cancelar um polo estável de G(z) 
sobre o eixo real. 
e Escolhe-se a localização do polo do compensador, tal que a condição de 


ângulo do lugar das raízes em relação ao ponto z = 29 seja satisfeita. 


3. Por fim, a condição de módulo é aplicada para se encontrar Ke, tal que 


Ah 
= cos 


2=2Z0 
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No MATLAB®, isso é feito como: Ke = 1/abs(evalfr(C*G_D,z0)). 


Com esse procedimento, as localizações dos demais polos do sistema podem não ser 
satisfatórias. Assim, algumas iterações dos passos 2 e 3 podem ser requeridas (tentativa 


e erro). O Exemplo 6.4 ilustra esse procedimento. 
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Figura 6.7 — Sistema de controle do Exemplo 6.4. 


Root Locus 


= 


OTs 
4 X 0.66024 


Y 0.246311 


Imaginary Axis 
o 


-0.5 + 


4 -3 -2 -1 0 1 2 
Real Axis 


Figura 6.8 — Lugar das raizes de G(z) do Exemplo 6.4. 


O zero de G(z) 


x polo de G(z) 


O zero de O(z) 


x polo de C(z) 


13,63º | 
DA 09 05 É 
0,66 


08 0,56 3 
-0,9672 0,41 


Figura 6.9 — Polos e zeros do sistema compensado do Exemplo 6.4. 
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Root Locus 


Imaginary Axis 


4 3 -2 -1 0 1 2 
Real Axis 


Figura 6.10 — Lugar das raízes do sistema compensado do Exemplo 6.4. 


e_ant u_ant 


To Workspace1 Data Store Data Store 
Memory Memory1 


To Workspace2 


Step1 Zero-Order 
Hold3 


Zero-Order To Workspace 
Hold1 


Zero-Order 
Hold4 


Figura 6.11 — Diagrama de blocos MATLAB/ Simulink® para a simulacáo do 
Exemplo 6.4. 
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ia Resposta ao Degrau ” Ação de Controle 
15 
e 18 
E 
E, 
3 sl 
a Quim Referéncia 
Resposta 0 
0.2 
0 : : -5 : : 
2 4 6 0 2 4 6 
t (s) nT; (s) 


Figura 6.12 — Resposta ao degrau unitário e sinal de controle do Exemplo 6.4. 


6.3.2 Compensador por atraso de fase 


O compensador por atraso de fase possui a seguinte estrutura: 
Zz— a 
z- B' 


Ao contrário do avanço de fase, o polo do compensador por atraso de fase é fixado 


-1<a<B<l. (6.6) 


à direita do zero do (a < 5). Tal compensador é utilizado para redução de erros em 
regime estacionário. A ideia é que o compensador náo interfira substancialmente na 
resposta transitória!, mas atue reduzindo o erro em regime estacionário. Para que isso 
seja satisfeito, o polo e o zero do compensador devem ficar muito próximos do ponto 
z = 1, ambos no interior do círculo unitário. Ainda, para que a resposta transitória nao 
se altere significativamente, o ganho do controlador deve ser aproximadamente unitário. 
Assumindo que as especificações de resposta transitória já estão satisfeitas, dois casos 


serão considerados: sistema tipo 0 e sistema tipo 1. 


Seja G(z) = a do tipo 0, ou seja, A(z), não possui raízes em z = 1. Consi- 


derando o controlador da forma (6.6), com ganho unitário, tem-se em malha aberta 


F(z) = > ON Nesse caso, como visto na Seção 5.3, o erro estático de posição é 


dado por: 
(6.7) 


¡Na realidade, tal compensador piora ligeiramente a resposta transitória, pois desloca 


o lugar geométrico das raízes para a direita. 
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Um simples procedimento de projeto consiste no seguinte: 


1. Determine o erro em regime estacionário desejado para o sistema compensado, 


considerando que ele é menor do que o do sistema sem o compensador. 


2. Fixe o polo do compensador bem próximo ao ponto z = 1. Por exemplo, 5 = 0,99 
ou 8 = 0,999. Quão próximo o polo deve ficar do ponto z = 1 depende do ajuste 
de ganho pela condição de módulo (passo 4 do procedimento seguinte), que deve 
resultar em um valor aproximadamente unitário. Quanto mais próximo o polo 
está de z = 1, menor é a distância relativa entre o polo e o zero do compensador, 
menores são suas contribuições de fase e módulo e mais próximo da unidade será 


o ganho ajustado para o compensador. 


3. O zero do compensador é determinado resolvendo-se (6.7) para ess e 3 conhecidos, 


ou seja, 
(1 — B)(1 — ess) 
(B(1)/A(1))ess * 


a=1 (6.8) 
4. Considerando que o LGR praticamente nao se alterou na regiao dos polos domi- 
nantes de malha fechada desejados?, aplique a condição de módulo para encontrar 


o ganho do controlador. 
Seja agora G(z) = an a do tipo 1, em que A(z) nao possui raizes em z = 1. 
Considerando novamente o compensador por atraso de fase com ganho unitário, tem-se 


F(z) = E En ae. Nesse caso, o erro estático de velocidade é dado por (5.12) 


Ts 
Css = (1-0) B0)’ (6.9) 
(1-8) AQ 


O procedimento de projeto é o mesmo do caso anterior, alterando-se apenas o item 


3, tal que 


3 O zero do compensador é determinado resolvendo-se (6.7) para ess e 3 conhecidos, 


ou seja, 
(BOA) ess 


Tal procedimento é aproximado, o que, em alguns casos, necessita de ajustes finos. 


a=1 


(6.10) 


2Pode-se verificar graficamente se há alterações significativas no LGR. A ideia é que 
não haja, pois não se deseja modificar as especificações da resposta transitória com este 


compensador. 
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O Exemplo 6.5 ilustra o procedimento de projeto de um compensador de atraso de 


fase. 
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Step Response Root Locus 


Imaginary Axis 
o 


5 4 3 2 4 0 1 
Time (seconds) Real Axis 

Figura 6.13 — Exemplo 6.5: resposta ao degrau do sistema em tempo discreto não 

compensado (esquerda) e LGR do sistema não compensado com os 


polos de malha fechada com realimentação unitária (direita). 
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Root Locus Resposta ao Degrau Unitario 


1.2 
(oo | 
5 System: CGd 
Gain: 0.978 1 
Pole: 0.825 + 0.264i 
a Damping: 0.421 
0.5 + 0:421 Overshoot (%): 23.3 
Frequency (rad/s): 3.42 0.8 
a 
<x 
fa E 
g 0 = 0.6 
> 
q 
E 


ammunanmesese Referência 
Sem Compensador 


-0.5 f 


0.2 ---- Com Compensador 
-1 | 
0 + L 4 
0 0.5 | 15 0 10 20 30 40 
Real Axis t (s) 


Figura 6.14 — Resultados do Exemplo 6.5: lugar das raízes do sistema compen- 
sado com os polos de malha fechada com realimentação unitária 


(esquerda) e resposta ao degrau do sistema compensado (direita). 


Data Store Data Store 
Memory Memory1 


Zero-Order 
Hold3 


Zero-Order To Workspace 
Hold1 


Step 
Zero-Order To Workspace1 
Hold4 


Zero-Order Zero-Order 
Hold2 Hold5 


Figura 6.15 — Diagrama de blocos MATLAB/ Simulink® para a simulacáo do 
Exemplo 6.5. 
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6.3.3 Controlador PID 


O PID digital básico com aproximação de Tustin na parcela integrativa e retangular 


para trás na parcela derivativa possui a seguinte função de transferência: 


PID(z) = Kp (+ E RE) 
(2 +1) 2-1 az(z—1)4+b2(z +1) +e(z-1)? 
e an? E de= , 


(6.11) 


com a= Kp,b= Kp ot ec= Kp E . De forma equivalente, pode-se escrever a Equação 


(6.11) como 


PID 2 = Co) (6.12) 


Assim, pode-se aplicar o método do LGR para projetar o PID. Uma solução razoável 


consiste em escolher um dos zeros do compensador para cancelar um polo estável da 
planta. Com isso, o outro zero é encontrado pela aplicação da condição de fase do LGR. 
Por fim, aplica-se a condição de módulo do para encontrar o ganho K. 

Para implementação utilizando a equação de diferenças do controlador, pode-se apli- 
car diretamente a transformada-z inversa em 
U(z) K(z-c)(z-c)z? K(1-cz!(z-—cz)) 
E(z) z(z— 1) a 1-271 ` 


PID(z) = (6.13) 


Note, entretanto, que, para obter as equações de diferenças do PID digital vistas 
no Capítulo 4 (anti-windup, filtro na derivada, derivada da saída), pode-se igualar os 
numeradores das Equações (6.11) e (6.12), e resolver o sistema de equações comparando 
os coeficientes dos polinômios em z para encontrar os valores equivalentes de Kp, Tr 
e Tp. Isso será feito utilizando o Symbolic Math Toolbox do MATLAB®, da seguinte 


forma: 


clear all: close all; cle 

syms z Ts Kp Ti Td K ci c2 a b e el c2 

a = Kp; b = Kp*Ts/(2*Ti); c = Kp*Td/Ts; 

num PID = collect (a*z*(z-1) + b*z*(zt+1) + c*(z-1)°2,z); 
Cf_1 = coeffs(num_PID,z); 

num_PID2 = collect (K*(z-c1)*(z-c2) ,z); 

Cf_2 = coeffs(num_PID2,z); 

X = solve(Cf 1(1)==Cf 2(1), Cf 1(2)==Cf 2(2), Cf 1(3)==Cf 2(3),Kp,Ti,Td); 
K_P = X.Kp; %Valor de K P 

Ti = K.Tis {Valor de T_I 

T.D = X.Td; %Valor de T_D 

disp (KP = "is pretty (K.P)g 
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disp (T_T = Os pretty(T_L); 
disp('T_D = '); pretty(T_D); 


Com isso, o seguinte resultado é obtido: 


K 
Kp= ata + co — 3c1¢c2 + 1), (6.14) 
Ts1+c1 + c2 — 3c1C2 
Tr = == ME 
"3 14-40 * (6.15) 
Tp = 27. = (6.16) 


ey +c — 3c1c2 +1 


A seguir é apresentado o Exemplo 6.6 com um projeto de PID digital. 
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O lugar das raízes do sistema compensado é apresentado na Figura 6.17. A resposta 
ao degrau unitário e o sinal de controle são apresentados na Figura 6.18. Observe que o 


projeto atendeu razoavelmente bem às especificações. 


eant 1 eant 2 u ant 


Data Store Data Store Data Store 
Memory Memory1 Memory2 


Zero-Order 
Hold3 


Zero-Order To Workspace 
Hold1 


Zero-Order 
Hold2 


Figura 6.16 — Diagrama de blocos MATLAB/ Simulink® do Exemplo 6.6. 


Root Locus 
2 : r , 


Imaginary Axis 


-2 -1 0 1 2 
Real Axis 


Figura 6.17 — Lugar das raízes e polos de malha fechada do sistema compensado 


com controlador PID do Exemplo 6.6. 
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Resposta ao Degrau Unitario Ação de Controle 


X 1.62 
Y 1.05608 


seal Referéncia 
Resposta com PID 
02 F 
0 E 25 


Figura 6.18 — Resposta ao degrau e sinal de controle do sistema compensado em 


malha fechada com controlador PID do Exemplo 6.6. 


6.4 Projeto pelo método da resposta em frequên- 
cia 
A forma tradicional de projeto de compensadores digitais no domínio da frequência 
utiliza diagramas de Bode no plano-w, através da seguinte transformação: 
1 + L w 


Z = 
Ts 
L=- &w 


Com isso, tendo G(z) chega-se em G(w). Assim, para projetar C(w), utilizam-se 
os mesmos procedimentos de projeto considerados no plano-s. Em seguida, C(w) é 
convertido de volta para C(z) pela transformação inversa, ou seja, 


2 2-1 
w= > E 
Tsz2+1 


A frequéncia de amostragem deve ser suficientemente alta para amenizar as distor- 
ções causadas pelas transformações. Com isso em mente, o projeto de controladores 
digitais no plano-w segue exatamente os mesmos procedimentos de projeto no plano-s 
apresentados em livros clássicos de engenharia de controle, por exemplo, [Ogata 2003], 
[Franklin, Powell e Emami-Naeini 2002], [Castrucci, Bittar e Sales 2018]. 
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Quando feito no domínio da frequência, o projeto de compensadores considera, ge- 
ralmente, como especificações a margem de ganho (MG), a margem de fase (MF), e 
a frequência de cruzamento de ganho (wg no caso contínuo ou vg no plano-w). Como 
ferramenta gráfica, o diagrama de Bode pode ser considerado. 

A seguir é apresentado um procedimento de projeto para controladores PI em que 
as especificações de desempenho são a margem de fase e a frequência de cruzamento 
de ganho, tal como em [Angélico, Campanhol e Oliveira da Silva 2014], onde também há 
um procedimento para projeto de controladores PID. 


No plano-w, um controlador PI pode ser descrito como 


Tw +1 
Cpr(w) = Ke, (6.17) 


sendo K. = K,/T;, em que K, é o ganho proporcional e T; o reset time do integrador. 


O procedimento de projeto é apresentado a seguir: 


1. Trace o diagrama de Bode do sistema a ser compensado, G(w). Calcule a fase 06 


do sistema na frequência de cruzamento de ganho especificada (vg). 


2. Verifique qual é a contribuição de fase Pc que o controlador PI precisa fornecer 
para garantir a MF desejada em vg. Note que dc precisar ser entre (0, —90°) 


para o controlador PI. 
3. Para obter T;, note que ZCpr(v) = de = atan(vaT;) — 90º, ou seja, 


T, = tan(do + 90º) 
VG 


4. Trace o diagrama de Bode de C,(w)G(w), onde Cby(w) = =*+*. Calcule o 
ganho necessário para que o gráfico de amplitude seja 0 dB em vg. Tal ganho é 


numericamente igual e Ke. 


O Exemplo 6.7 aplica esse procedimento de projeto. 


£ Exemplo 6.7: Considere o seguinte sistema: 


0,1 
dia s+1' 


Ao assumir T, = 0,2 s, o equivalente discreto com ZOH é dado por 


0,01813 
CAS ler 
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Bode Diagram 


Magnitude (dB) 
sb & 8 


ES 
a 


System: G(w) 
Frequency (rad/s): 2 
-135 Phase (deg): -74.9 
-180 
107 10° 10! 102 


Phase (deg) 
Ss 


Frequency (rad/s) 


Figura 6.19 — Diagrama de Bode de G(w) do Exemplo 6.7. 
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Bode Diagram 
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Figura 6.20 — Diagramas de Bode de G(w) e Cp,(w)G(w) do Exemplo 6.7. 


Bode Diagram 
Gm = 16.2 dB (at Inf rad/s), Pm = 60 deg (at 2 rad/s) 
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Figura 6.21 — Diagrama de Bode do sistema compensado no plano-w com as 


margens de ganho e de fase do Exemplo 6.7. 
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Bode Diagram 
Gm = 16.2 dB (at 15.7 rad/s) , Pm = 60 deg (at 1.97 rad/s) 
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Figura 6.22 — Diagrama de Bode do sistema compensado no plano-z com as 


margens de ganho e de fase do Exemplo 6.7. 
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Figura 6.23 — Resposta ao degrau e sinal de controle sistema compensado no 


Exemplo 6.7. 
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No Exemplo 6.8 esse mesmo problema é resolvido, mas considerando agora a com- 
pensação pela resposta em frequência diretamente no plano-z. Isso nao é comumente 
encontrado na literatura de controle digital, devido à característica não assintótica do 
diagrama de Bode. Para evitar os efeitos de distorgao em altas frequéncias, tal procedi- 
mento é recomendado para frequéncias de cruzamento de ganho da ordem de pelo menos 


uma década abaixo de w,/2. 
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Bode Diagram 
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Figura 6.24 — Diagrama de Bode de G(z) do Exemplo 6.8. 
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Figura 6.25 — Diagramas de Bode de G(z) e Cpy(2)G(2) do Exemplo 6.8. 
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Bode Diagram 
Gm = 16.1 dB (at 15.7 rad/s) , Pm = 60 deg (at 2 rad/s) 
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Figura 6.26 — Diagrama de Bode do sistema compensado no plano-z com as 


margens de ganho e de fase do Exemplo 6.8. 
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Figura 6.27 — Resposta ao degrau e sinal de controle sistema compensado no 


Exemplo 6.8. 


Capitulo 7 


Projeto Direto de Controladores 


Digitais 


Neste capítulo o projeto de controladores digitais será feito a partir de um mo- 
delo de referência de tempo discreto em malha fechada, Gyyr(z). O controlador digi- 
tal C(z) será sintetizado de forma que a malha fechada discreta resulte no modelo de 
referência desejado. Isso é conhecido na literatura como método direto de Ragazzini 
[Franklin, Powell e Workman 2006]. 

Em suma, o controlador resultante tende a cancelar a dinâmica do processo e impor 
a dinâmica desejada em malha fechada. Com isso, algumas restrições no modelo de 
referência precisam sem impostas para garantir estabilidade, causalidade, entre outros 
aspectos, como será visto em seguida. 

Inicialmente, o método de Ragazzini é descrito e, em seguida, dois casos particulares 


são apresentados: dead beat e Dahlin. 
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7.1 Método de Ragazzini 


Considere o sistema da Figura 7.1. 


Figura 7.1 — Controle digital com realimentação unitária. 


Em malha fechada: 


Y(z) _ _ _C(z)G(z) 
RO 7 Gur(z) = 1+C@G@’ (7.1) 
Ao isolar C(z), tem-se: 
Gta = mrle) (7.2) 


~ G(z)1—Gmr(z) 
Note que em (7.2) o controlador inverte a planta. Obviamente isso não é possível 
para todos os casos. O projeto se resume em escolher adequadamente Gmp(z). A seguir 


serão apresentadas algumas condições para que exista um controlador neste formato. 
e Causalidade 


Inicialmente, C(z) precisa ser causal, ou seja, ele não pode possuir mais zeros finitos 
do que polos finitos. De (7.2), se G(z) possuir zeros no infinito, então C (z) terá mais 
zeros finitos que polos, a menos que Gyp (2) tenha os zeros no infinito de G(z). Portanto, 


Gmpr(z) deve ser escolhida respeitando a seguinte condição: 


Cl: Gmr(z) deve possuir número de zeros no infinito maior ou igual ao número de 


zeros de G(z) no infinito. 


Uma consequência direta da condição C1 é que o atraso em G mp(z) precisa ser igual 
ou maior do que o atraso em G(z). A ordem de Gmr (z) também deve ser maior ou igual 
à ordem de G(z). 


e Estabilidade 


Os zeros de C(z) nao podem cancelar polos instáveis de G(z). Suponha que G(z) 
possua um polo fora do círculo unitário. Dessa forma, de (7.2), a parcela do contro- 


lador que inverte a planta terá um zero fora do círculo unitário cancelando esse polo 
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instável, a menos que o numerador do termo 1 — Gmr(z) cancele tal termo. Disso vem 


a primeira condição de estabilidade quanto à escolha de Gyyr(z), definida aqui como C2: 


C2: [1 — Gup(2)] deve possuir como zeros todos os polos instáveis de G(z). 


Além disso, os polos de C(z) não devem cancelar eventuais zeros de fase não minima 
de G(z). A equação característica do sistema é dada por 1+C(z)G(z) = 0. Suponha que 
G(z) possua um zero fora do círculo unitário. Com isso, verifica-se em (7.2) que o termo 
do controlador que inverte a planta terá um polo fora do círculo unitário, a menos que 
esse zero seja cancelado pelo numerador de Gyp(2), resultando na segunda restrição de 


estabilidade, definida aqui como C3: 


C3: Gme(z) deve ter como zeros todos os zeros de fase não mínima de G(z). 


e Erro Estacionário 


O sinal de erro é definido como 


E(z) = R(z) — Y (2) = R(2) — Gur(2)R(2) = R(2)[1 — Gmr (2)], (7.3) 
sendo R(z) a entrada de referência e Y(z) a saída da planta. O erro em regime estacio- 


nário é dado por 


lim ejn] = lim (1—27*) E(2) = lim (1 — 27) R(z)[1L — Gur(2)). (7.4) 


n—>00 251 251 
Se R(z) for um sinal degrau unitário, R(z) = 1, tem-se 


1 
a E ol 
oan = ele) ge 


= Ghana) (7.5) 


Se o sistema for tipo 1 ou mais, então lim efn] = 0 e, portanto, chega-se à seguinte 
n—>00 


condição: 


C4: Para que o sistema seja tipo 1 ou mais deve-se garantir que Gup(1) = 1. 


A condição C4 resulta em erro nulo para entrada do tipo degrau. Por outro lado, 


= 
para entrada R(z) = aupa ou seja, rampa unitária, 


Ty! ; Tz 
ap Bl Cal 


lim e[n] = lim (1 — 25 — Gue(z) (7.6) 


n—o00 
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Para calcular o limite anterior é necessário aplicar a regra de L’Hospital, o que resulta 
em 


lim e[n] = —T; dGur(2) 


n—00 dz 


(7.7) 


al 


Se o sistema for tipo 1, lim e[n] = = para entrada rampa, o que resulta na seguinte 
n co a 


condição: 


dG F(z) 
dz 


C5: Para que o sistema seja tipo 1 deve-se garantir que 


z=1 


As condições C4 e C5 garantem a síntese de um sistema tipo 1, ou seja, que tenha 
erro nulo para entrada degrau e erro finito e igual a 1/K, para entrada rampa. 
Se o sistema for tipo 2 ou mais, então lim e[n] = 0 para entrada rampa. Portanto, 


n—00 
tem-se a seguinte condição: 


dGme(z) 


dz =0. 


C6: Para que o sistema seja tipo 2 deve-se garantir que 


z=1 


As condições C4 e C6 garantem a síntese de um sistema tipo 2, ou seja, que tenha 
erro nulo para as entradas degrau e rampa. 

No projeto pelo método direto, se T, for muito pequeno, o sinal de controle pode ser 
muito elevado e atingir a saturação. Se, por outro lado, T, for muito grande o sistema 
pode se tornar instável. Na prática, deve-se escolher T, pequeno suficientemente para 
não se ter saturação [Castrucci, Bittar e Sales 2018]. 


Um projeto de controlador é apresentado no Exemplo 7.1. 


£ Exemplo 7.1: Considere a seguinte função de transferência: 


i 


SI s(7s +1) 


Projete um controlador digital pelo método direto, utilizando T, = 0,5 s, de tal forma 
que o equivalente contínuo do sistema em malha fechada seja de segunda ordem, com co- 
eficiente de amortecimento ¢ = y2 /2, frequência natural wn = 1 rad/s e que a constante 


de erro estático de velocidade do sistema K, = 1. 
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Figura 7.2 — Diagrama de blocos utilizado nas simulações do Exemplo 7.1. 
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Resposta ao Degrau Unitário 
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Figura 7.3 — Resposta ao degrau e sinal de controle do sistema compensado do 


Exemplo 7.1. 
i0 Resposta à Rampa Unitária 
= ph 
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Figura 7.4 — Resposta à rampa e sinal de controle do sistema compensado do 


Exemplo 7.1. 


Projeto Direto de Controladores Digitais 155 


O comportamento oscilatório entre períodos de amostragem na resposta ao degrau 
do sistema em tempo contínuo, observado no Exemplo 7.1, ocorre principalmente de- 
vido a ganhos elevados do controlador e/ou à presença de zeros de G(z) próximos à 


circunferência unitária. Note, a partir da Figura 7.1, que 
o Yala) = Gur(z) 


U(z) = da Ge) R(z). (7.8) 
Definindo G(z) = N(z)/D(z), tem-se que 
U(z) _ D(z) 
R() = Gmr(z) N(2) . (7.9) 


Se R(z) é do tipo degrau, para o sinal de controle ser constante após o período tran- 
sitório da resposta, os polos de (7.9) devem ficar afastados da circunferéncia unitária. 
No exemplo anterior os polos de Gyp (2) estão relativamente afastados da circunferência 
unitária e, portanto, os zeros de G(z) são responsáveis pelas oscilações. Para solucionar 


este problema acrescenta-se a seguinte condição: 


C7: Gmr(z) deve ter como fatores comuns no numerador todos os zeros de G(z) 


próximos à circunferência de raio unitário. 


O mesmo problema do Exemplo 7.1 é resolvido no Exemplo 7.2, mas agora conside- 
rando a condição C7 adicionalmente. 
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osta ao Degrau Unitário 
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Figura 7.5 — Resposta ao degrau e sinal de controle do sistema compensado do 
Exemplo 7.2. 
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Figura 7.6 — Resposta á rampa e sinal de controle do sistema compensado do 


Exemplo 7.2. 


7.2 Controle dead beat 


Se a resposta transitória de um sistema possuir tempo de acomodação mínimo, erro 
estacionário nulo e nao apresenta oscilações entre instantes de amostragem, a mesma é 
definida como dead beat [Ogata 1995], [Castrucci, Bittar e Sales 2018]. 


Nesse caso, Gmr(z) possui a seguinte forma: 


G boz? bar + bozP™? +... + bp 12 + bgp 
mr(2) = zP (7.11) 


= bo+bizl+ba2 +. .+bp 12 7P + dpz?. 


com p > n, sendo n a ordem da planta. O sistema em (7.11) é uma estrutura com 
resposta impulsiva finita (FIR, Finite Impulse Response), naturalmente estável e que 
garante tempo de acomodagao finito para a resposta em tempo discreto. Note que, neste 
caso, para respeitar a propriedade de causalidade, o menor atraso em Gyp(z) deve ser 
no mínimo igual ao menor atraso em G(z). Se, por exemplo, a expansão de G(2) começar 


em 27?, então Gyp(z) deve ser da forma 
Gur(z) = bez? +... + bp-12 P + bpz ?. (7.12) 


Obviamente, deve-se testar se as demais restrições são satisfeitas. 
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Uma escolha particularmente simples para Gme(z) é tal que uma entrada de- 
grau é seguida pelo sistema com atraso de um ou mais períodos de amostragem 
[Fadali e Visioli 2013]. Assim, 


Gure) =z; p>1. (7.13) 


Logo, 
1 gP 1 1 


ov) = G(z) 1— z7? E G(z) z? — 1 


(7.14) 


O valor de p deve ser escolhido para garantir a causalidade de C(z). Por exemplo, 
se a planta tiver m zeros no infinito, Gmr(z) deve possuir p > m zeros no infinito. Vale 
ressaltar que tal controlador resulta em esforços de controle elevados, o que limita sua 
utilização em aplicações práticas. 

Note de (7.12) que a estrutura FIR desejada em malha fechada permite especificar 
o tempo de acomodação mínimo da resposta em tempo discreto, bem como o compor- 
tamento da resposta transitória discreta. Considere, por exemplo, que G(z) seja de 
fase mínima e possua um zero no infinito. Se (7.13) fosse considerada, resultaria em 


l e no perfil apresentado na Figura 7.7(a). Outra opção seria considerar 


Gur(z) = 27 
um perfil rampa, como o da Figura 7.7(b), ou mesmo um perfil em “S” aproximado como 


o da Figura 7.7(c). 


(a) Degrau (b) Rampa (c) Formato “S” 


Figura 7.7 — Exemplos de perfis para resposta dead beat. 


No exemplo com G(z) de fase mínima e com um zero no infinito, para for- 
mar um perfil em rampa como o da Figura 7.7(b), pode-se escolher os coeficientes 
b= [bi da... Ppa bp] de 


Gup(z) = biz! + bez? +... + bp-i? +o’, (715) 
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tal que 
[LA s 2 all 
b= xP 
am bi 
Para a curva com formato aproximado de “S”, se p for par, pode-se fazer 
E co p/2 p/2 ... 1] 
b= ww >>>, 
Ela bi 
Para p ímpar, pode-se escolher 
, Do (p+D/2 .. 1] 
E Ea b; 
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A Tabela 7.1 apresenta vetores de coeficientes na forma de “S” para algumas ordens 


específicas de Gu r(z). Quanto maior p, maior é a ordem do controlador gerado, o que 


pode resultar em controladores com ordens elevadas. 


Tabela 7.1 — Coeficientes para perfil aproximado na forma de “S” para a resposta 


dead beat. 


O produto px T, é uma medida do tempo de duração da resposta transitória discreta. 


Controladores dead beat são projetados no Exemplo 7.3. 
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Os diagramas de simulação são apresentados nas Figuras 7.8(a), (b) e (c). Os códigos 


das Matlab Functions dos controladores são, respectivamente, dados por 


function wi. = featel_,a2a11,b11) 

global ei ant. ei ant ant. ui ant. ul ant ant. 

ui. = -aii(1)*ut_ant_ -ai1i(2)+*ui ant ant + b11(1)x*re1_ + 
b11(2)*e1_ant_ + b11(3)*e1_ant_ant_; 

ul -ant ant. = ul antes ulant. = ul: 

el_ant_ant_ = el_ant_; el_ant_ = el_; 

function u2. = fen(el- b21,a21,) p22, a22) 


global ei ant. ei ant ant. ui ant. ui ant ant. 


global u2 ant. u2 ant ant. 


ui. = -a21(1)*u1_ant_ -a21(2)+*ui ant ant. + b21(1)*e1_ + 
b21(2)xe1 ant. + b21(3)xe1i ant ant; 

u2_ = -a22(1)+*u2 ant. -a22(2)+u2 ant ant. + b22(1)x*u1_ + 
b22(2)*u1_ant_ + b22(3)x*u1_ant_ant_; 

ui ant ant. = ui ant: ut ant = ui: 

ei ant ant. = ei ant.; ei ant. = el_; 

u2 ant ant. = u2 anto. ugsant = 1225 


function us = fen(el, a32, a33, asi, b33, b32, b31) 
global ei ant ei ant ant ui ant ui ant ant 

global u2 ant u2 ant ant 

global u3 ant u3 ant ant 


ui = -a31(1)*ul_ant -a31(2)+xui ant ant + b31(1)*e1 + b31(2)*e1_ant +... 
b31(3)xei ant ant; 

u2 = -a32(1)*u2_ant -a32(2)+*u2 ant ant + b32(1)x*u1 + b32(2)+*ul ant +... 
ps2(2)+n1l ant ant: 

us = -a33(1)*u3_ant -a33(2)+u3 ant ant + b33(1)*u2 + b33(2)+*u2 ant +... 
b33(3)*xu2 ant ant; 

ui ant ant = uil ant; ui ant = ul; 

ei ant ant = ei ant; ei ant = el; 

u2 ant ant = u2 ant; u2 ant = u2; 

us ant ant = vu3cant; v3 ant = u3: 


As respostas estão apresentadas na Figura 7.9, com os respectivos sinais de controle 
da Figura 7.10. Note que as respostas em tempo discreto satisfazem a especificação 
do enunciado. No entanto, o controlador com p = 1 resultou em rippling considerável 
na resposta em tempo contínuo. Para os casos em que o controlador foi sintetizado 
considerando uma resposta no formato de “S”, tanto em tempo discreto quanto em tempo 


contínuo, a especificação de desempenho não foi violada. 
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etant||ut ant | jet ant ant| | ul ant ant etant |jutant ||etantant |jutantant | >| ul 
alo pulicar a | a 
Yis) Y(z) 
SED bef} AR pos 
Caz 


(a) SIM 07.03. a.slx 


neta Sete DEISE 
Lh} 


(b) SIM_07_03_b.slx 


nail 
E ges Ea 


(c) SIM_07_03_c.slx 


Figura 7.8 — Diagramas de simulação do Exemplo 7.3. 
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Resposta ao Degrau Unitário 
ad i + T 


y(t), y(nT,) 
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Figura 7.9 — Resposta ao degrau do sistema compensado do Exemplo 7.3. 


Ação de Controle 


0 0.5 1 1.5 2 29 3 
nT 


Figura 7.10 — Sinal de controle dos casos do Exemplo 7.3. 
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7.3 Controle Dahlin 


O controlador Dahlin considera que a função de transferência em malha fechada seja 


a forma discreta de um sistema de primeira ordem com atraso de transporte. No plano-s, 


tem-se 
ee 
Gmr(s) = EE (7.16) 
Após discretização, verifica-se que 
¿1 (1 = e Tola) 1-eTs/a 
Gmr(2) = eh) De Taz) =i. e (1.17) 


O termo k deve ser escolhido para garantir causalidade!. A função de transferência 


do controlador é, portanto, obtida como 


do = Lu) 210 eet 
~ G(z)1-Gyr(z) G(z)1-— e-T:/az71 — (1 -e-To/0) g-h-1 
1 1—e7T:/4 


= G@ tl ARA A e Tay (7.18) 


Os Exemplos 7.4 e 7.6 projetam controladores tipo Dahlin. 


LA relação entre k e a é tal que k = [a/Ts]. 
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_Resposta ao Degrau Unitario 
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Figura 7.11 — Resposta ao degrau e sinal de controle do Exemplo 7.4. 
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Ação de Controle 
20 


nT, (s) 


Figura 7.12 — Resposta ao degrau e ao sinal de controle do Exemplo 7.5 sem con- 


siderar compensação das oscilações entre períodos de amostragem. 
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Resposta ao Degrau Unitario 
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Figura 7.13 — Resposta ao degrau e ao sinal de controle do Exemplo 7.5 com 


compensação das oscilações entre períodos de amostragem. 
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Figura 7.14 — Diagrama de blocos MATLAB/ Simulink® do Exemplo 7.6. 
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Figura 7.15 — Resposta ao degrau e ao sinal de controle do Exemplo 7.6. 


Capitulo 8 


Controle Digital por Variaveis de 
Estado 


Este capítulo apresenta análise e controle de sistemas LIT em tempo discreto 
considerando a representação em espaço de estados. Seja um sistema dinâmico 


de múltiplas entradas e múltiplas saídas (MIMO, Multiple Input Multiple Output) 


com r entradas, ui(t), ua(t), ..., ur(t), m saídas, yi(t), ya(t), ..., Ym(t) e k estados, 
x(t), vo(t), ..., k(t). Pode-se ter a seguinte representação em espaço de estados: 
x(t) = f(x(t), u(t)), (8.1) 
y(t) = g(x(t), u(t)), (8.2) 


em que a primeira equação é denominada equação de estado e a segunda equação de 
saída, x(t), u(t) e y(t) são, respectivamente, os vetores de estado, de entrada e de saída. 
As funções f e g, no caso geral, são não lineares e variantes no tempo. 

Se o conjunto de equações em questão for linearizado em torno de algum ponto de 


equilíbrio, tem-se a seguinte representação em espaço de estados: 


me 
— 

+ 
— 

II 


Ax(t) + Bu(t), (8.3) 
Cx(t) + Du(t), (8.4) 


< 

— 
+ 

=> 


em que A (k x k) é chamada de matriz de estado, B (k x r) de matriz de entrada, 
C (m x k) de matriz de saída e D (m x r) de matriz de transicáo direta. Aqui seráo 


considerados sistemas invariantes no tempo, tais que as matrizes da representação em 
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espaço de estados não dependem explícita ou implicitamente do tempo. Neste caso, 


tem-se a classe de sistemas LIT, como ilustrado na Figura 8.1. 


Figura 8.1 — Diagrama de blocos de um sistema LIT de tempo contínuo repre- 


sentado no espaço de estados. 


Para sistemas em tempo discreto, as equações de estado e de saída podem ser repre- 
sentadas como 
xn+1) = f(x[n], u[n],n), (8.5) 
yin] =  g(x[n],u[n],n), (8.6) 
em que x[n], u[n] e y[n] são, respectivamente, os vetores de estado, de entrada e de saída 
em tempo discreto. 
Para sistemas LIT de tempo discreto, tem-se a seguinte notação: 
x[in+1] = Sx[n] + Pu(n], (8.7) 
yin) = Cx[n]+ Dun], (8.8) 
em que 9 agora (k x k) é a de matriz de estados, I (k xr) a matriz de entrada, C (mx k) 


a matriz de saída e D (m x r) matriz de transição direta. A representação em diagrama 


de blocos desse sistema de equações lineares é mostrada na Figura 8.2. 


Figura 8.2 — Diagrama de blocos de um sistema LIT de tempo discreto repre- 


sentado no espaço de estados. 


Particularmente, neste livro, serão considerados sistemas LIT de tempo discreto. 
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8.1 Linearização de equação de estados não linear 


Considere o sistema não linear descrito em (8.1)-(8.2). De forma expandida, para a 


dinâmica dos estados 


i(t) = fi (x(t), u(t)), 


ta(t) i fo (x(t), u(t), (8.9) 


Er (t) fe (x(t), u(t). 


Considere a linearização em torno do ponto de equilíbrio (xo, uo), em que 

T 
Xo = Ex 120 «ss pol © Uo = fino u20 .- tro] . Para cada equacáo da 
dinámica do sistema, f; (x(t), u(t)), pode-se efetuar uma expansáo em série de Taylor 


em torno de (xo, Ug), tal que 


fi (x(t), u(t)) = f; (Xo, uo) + Ay ++ Azk + 
9x1 (xo, uo) OL; (xo, uo) 
ah Au +...+ a Au, + T.O.S., (8.10) 
U1 | (xo, uo) Ur | (xo, uo) 


em que Az; = x; — Tio € Au; = uj — ujo. Ao desprezar os termos de ordem superior 
(T.O.S.), tem-se que 


at — Bh 


Azı +... + Azk + 
dx (xo, uo) OL (xo, uo) 
Of Any +...4 PA Aur. (8.11) 
du (xo, uo) ður (xo, uo) 
Na forma matricial, para i = 1, 2,...k, tem-se 
Of 2h A 
921 | (39, up) Ot | (xp, up) 
Ax = = es oa : + 
oft. Ofi 
921 | (9, 110) 92% | (xx0,u0) A 
Ofi Ofi 
Oui (xo, uo) see paai Au 
oad : ‘ (8.12) 
dfr Ofte 
asa (xo, uo) othe mm Atty 
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Similarmente, para a saída do sistema 


Ig Ogi A 
921 | (x9, uo) 97% | (9, u0) a 
Ay = + 
Ogm. Ogm A 
on am x 
921 | (x9, 19) 97% | (xo, 110) é 
gı Ogi 
Oia A 
du I(x, uo) Our |(xo,uo) | | 
(8.13) 
Ogm Ogm A 
“om u 
dui |p, 10) dur | (xo, 10) É 


Observe que a dinâmica de Ax representa o comportamento do sistema em torno do 
ponto de operação (xo, Uy) que, em muitos casos, é a origem, ou seja, pode-se eliminar 
a notação com A e manter apenas x, sendo que agora o vetor de estados representa 
uma dinâmica linear. De qualquer forma, para fins de simplificação da notação, vamos 


desconsiderar a notação com A, o que resulta na seguinte representação: 


x = Ax+Bu, (8.14) 
y = Cx+Du, (8.15) 
em que 
Of, Ofi of of 
Gai (xo, uo) dp (xo, uo) ema (xo, uo) Oily (xo, uo) 
A = , B = e , 
Of Ofte Ofte ofr 
9%1 | (xo, uo) Ok | (x0, uo) 9u1 I (xo, uo) Our I (xo, uo) 
Ig Og Og. ðgı 
am (xo, uo) OT (xo, uo) eua (xo, uo) Be (xo, uo) 
C = 5 D = 
Ogm Ogm Ogm. Ogm 
na (xo, uo) dk (xo, uo) aie (xo, uo) a (xo, uo) 


As matrizes A e B são os Jacobianos de f em relação a x e u, enquanto C e D são 
os Jacobianos de g em relação a x e u, respectivamente. 


O Exemplo 8.1 apresenta esse procedimento. 
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2 


Figura 8.3 — Diagrama esquemático do péndulo invertido do Exemplo 8.1. 


8.2 Discretização de equação de estados contínua 


Verificou-se que a solução da equação de estados dada em (8.3) é da forma 
t 
x(t) = e®® x(0) + / eA(-7) Bu(r) dr. (8.16) 
0 


A representação em tempo discreto para (8.3) é dada por 
x([n + 1]T,) = ®x(nT,) +Tu(nT;). (8.17) 


Para determinar ® e T, pode-se utilizar a equação (8.16). Assume-se, adicionalmente, 


que a entrada u(t) é amostrada e mantida constante dentro do período de amostragem 
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(segurador de ordem zero), tal que u(t) = u(nT;,), para nT, < t < (n + I)T.. Desta 


forma, verifica-se que 


(n+1)Ts 
x([n + 1]T,) = AHIT) x (0) + eAIn+HTS) / e 47 Bu(r) dr, (8.18) 
0 
e, 
nT, 
x(nT,) = eA Ts) x(0) + eA (Ts) i e 47 Bu(r) dr. (8.19) 


0 
Multiplicando (8.19) por e*7* e subtraindo de (8.18), obtém-se 


(n+1)Ts 


x([n + 1]T,) = eA: x(nT,) + Alt UT) J e Bu(r) dr, (8.20) 
nT, 
que pode ser reescrita como 
(n+1)T, 
x([n + 1]T,) = e*% x(nT,) + / en+UT,-7) dr Bu(nT,). (8.21) 
nT, 


Em seguida, substituindo n = nT, + Ts — 7 em (8.21), obtém-se 


Ts 
x([n + 1]T,) = e** x(nT,) + fes dn Bu(nT;). (8.22) 
0 
Comparando a Equação (8.7) com a obtida em (8.22), verifica-se que $ = eAT: e 


Ts 
F=f e“"dnB. Desta forma, tem-se o equivalente discreto do sistema em espaço de 
0 


estados. Note que ® e T dependem de T,. Se A for não singular, então a seguinte 
simplificação pode ser feita [Ogata 1995]: 
Ts 
r= je dy | B= A! (e4™ — I) B= (e TAB. (8.23) 
0 
Quanto à equação de saída, como nao há dinâmica, sua versão discreta é simplesmente 
dada por 
y ([n + 1]75) = Cx(nT;) + Du(nT;). (8.24) 


No MATLAB®, o comando c2d pode ser utilizado para encontrar a representação 
discreta com segurador de ordem zero, da seguinte forma: [Phi,Gamma] = c2d(A,B,Ts). 


O Exemplo 8.2 considera a discretização de uma representação no espaço de estados. 
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8.3 Solução da equação de estados em tempo dis- 


creto 


A solução de (8.7) pode ser obtida diretamente por um procedimento de recursão, 


tal que 


= 62x [0] + $Tu[0] + Tull], 


x[3] = &x[2] + Pul2] = 53x[0] + 62Tu[0] + rul] + Tula), S25) 
sendo que, no instante n, tem-se 
n—1 
x(n] = &"x[(0] + > 9"Tulj], n=1,2,3,.... (8.26) 
j=0 
Substituindo (8.26) na equação de saída, obtém-se 
n—1 ; 
yin] = C&"x[0] + CY "4 Puli] + Dun], n=1,2,3,.... (8.27) 
j=0 
Observe que a solução homogênea é dada por 
x[n] = 9"x[0] = W[n]x[0], (8.28) 
onde W[n] = 6” é uma matriz k x k que satisfaz a seguinte condição: 
Vin+1] = OV [nj], V|0] =I. (8.29) 


Note que a solução em (8.26) é simplesmente uma transformação do estado inicial. 
A matriz Y[n], portanto, denomina-se matriz de transição de estados (ou matriz fun- 
damental). Em termos da matriz de transição de estados, a solução em (8.26) pode ser 
reescrita como 


W[n]x(0] + Y Win — j — uly) 
j=0 
= YIn]x[0] + x [j] ujn — j — 1]. (8.30) 


j=0 


x[n] 


Com isso, a equação de saída é dada por 


yin] = CWin]x[0] + C y D[¡Puín — j — 1] + Duln]. (8.31) 


j=0 
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Uma forma alternativa de obtenção de W[n] é considerada a seguir. Seja a equação 


de estados discreta em (8.7). Ao aplicar a transformada-z, tem-se que 


zX(z) — zx[0] = ®X(z) + TU(z). (8.32) 
Então 
(21—- ®) X(z) = id +TU(z), ” (8.33) 
=> X(2)=(21-6) * zx[0] + (¿1- 9) TU(z), 
aplicando a transformada-z inversa em (8.33), obtém-se 
x(n] = 2" {(a _ 6)! z} x[0] + 21 (a a” ru(=)) l (8.34) 
Comparando (8.34) a (8.30), pode-se constatar que 
Vin] = 22 [(1-8)*2), (8.35) 
n—1 
> vijrun-j-1) = 27 ((1-8)*TrU()). (8.36) 
j=0 


8.4 Matriz de transferência discreta 


Um sistema de uma entrada e uma saída (SISO, Single Input Single Output) pode 
ser modelado por uma função de transferência discreta. Tal representação pode ser 


generalizada para sistemas MIMO, chegando-se em uma matriz de transferência discreta. 


Seja a representação discreta em espaço de estados de (8.7)-(8.8). Ao aplicar a 


transformada-z e considerar condições iniciais nulas, obtém-se 


WN 
[at 
~ 
R 
See 
ll 


PX(2) +TU(2), (8.37) 
Y(2) = CX(2) +DU(z). (8.38) 


Isolando X(z) em (8.37) e substituindo em (8.38), chega-se em 
Y (2) = [C(21— 9) *T + D] U(2). (8.39) 
Como Y (2) = G(z)U(z), tem-se que 
G(z) = [C(21- $) 'T + D]. (8.40) 


A matriz G(z) (m x r) é conhecida como matriz função de transferência discreta 
e caracteriza a dinâmica de entrada-saída do sistema em tempo discreto descrito em 
(8.7)-(8.8). 
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Note que 
_ adj(zI — ®) 
1-6)! = 8.41 
aa - ARO, (8.41) 
com adj(M) sendo a matriz adjunta da matriz M!. Assim, 
Cadj(21— &)T 
y SAE DE a y, (8.42) 


|zI — 6] 


Logo, os polos de G(z) são os autovalores de ®. 


8.5 Transformação de similaridade 


A representação em espaço de estados não é única para um mesmo sistema. Duas 
realizações mínimas de uma mesma matriz de transferência são relacionadas por uma 
transformação de similaridade. 

Duas matrizes quadradas ® e ®, são ditas similares se existir uma matriz T não 
singular tal que $ = TIST. 

Considere o sistema das Equações (8.7)-(8.8) e a seguinte transformação: x = Tx. 


Assim, 


Txn+1) = STx[n)+Tuín), (8.43) 
yin] = CTx[n] + Dufnl]. (8.44) 


Como T é não singular, pode-se multiplicar (8.43)-(8.44) à esquerda por T71, o que 


resulta em uma nova representação em espaço de estados, ou seja, 


xin+1] = T*9STx[n] + TT ujn], (8.45) 
$ r 
yin] = CT xin] + Duln], (8.46) 
Cc 


em que $ = T-1$9T,T = TIT e C = CT. 
Duas matrizes similares possuem os mesmos autovalores, i.e., o mesmo polinômio 


característico. Para verificar isso, considere a equação característica de ®, tal que 


|AI — 8| =0> [ATT -T*8T| = 0 => |T (AL — &)T| = 0. (8.47) 


1A matriz adjunta de uma matriz quadrada M é a transposta da matriz que se obtém 
substituindo-se cada termo M; pelo determinante da matriz obtida retirando-se a t- 


ésima linha e a j-ésima coluna de M, multiplicado por (—1)**/. 
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Pelo teorema de Binet, o determinante do produto de matrizes quadradas é o produto 
dos seus determinantes. Assim, 
¡TAL —S)T| = 0 => |T—*| |(AI — D)||T|=0. (8.48) 
Como T é não singular, então |T| 4 0 e |T~!| 4 0. Logo, 
|AI — | =0 > |M- $| =0, (8.49) 


o que prova a invariância dos autovalores a uma transformação de similaridade. Uma 
representação em espaço de estados é transformada em outra com mesma dinâmica por 
meio de uma transformação de similaridade. 


Algumas representações são apresentadas a seguir. 


8.5.1 Forma canônica controlável 


Considere um sistema SISO dado por 


x[n+1]) = Sx[(n] +Tuln], (8.50) 
yin] = Cx[n]+ Dulnl]. (8.51) 


0 
0 
xcln + 1] = xc[n] + ujn], (8.52) 
0 00 1 0 
~ao 41 42 + —0k-1 
— and EJ 
yin] = [bo fr ... Bas] xol] + Dun]. (8.53) 
ag 


Co 
Define-se a transformação x[n] = T xc[n]. Com isso, TtT = c, TT =T0G,e 


CT = Cc. Para encontrar a matriz T, considere que ela tenha a seguinte estrutura: 
T= [tr ti is te (8.54) 


Note que 
Loe FS th = E, (8.55) 
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ou seja, a última coluna de T é a matriz de entrada. Para determinar as demais colunas, 


considere a relação TIT = Po, tal que 


ST = To 
ES St. ... Sty Dt; = (8.56) 
[apt ti —ajt, t2—aztk --- tp o— ap-otk tro — Goat | - 


Ao comparar as matrizes em (8.56), da última coluna até a segunda, verifica-se que 


Ot; = tk-1 — ap_ity, > te_1 = akıl + OT, 
Pt, 1 = tk—2 — ak—2tk > tk—2 = ag 21 + ap BT + PT, 


tə = tı —ait, => 
tı =al + ag@T + ag@2T +--- + a,_18* T + 6817. 


Portanto, a matriz T é dada por 


a a ag -akil 
a2 03 10 
F=|r r er o op air | a3 ak—1 0 0 
_—_—_——— =a. = 1 
C QAk-1 
Gh-1 1 0 
1 0 O sa O 0 
————————— 
Ta 
(8.57) 


Será visto mais adiante que C em (8.57) representa a matriz de controlabilidade do 
sistema (8.50)-(8.51). Caso o sistema seja controlável (conceito a ser visto na seção 8.7), 
C admite inversa. Portanto, para transformar um dado sistema como em (8.50)-(8.51) 
para sua forma controlável, utiliza-se a matriz de transformação T7! = (CT,)~!, em 
que T, é a matriz triangular superior como em (8.57), formada pelos coeficientes do 
polinômio característico da matriz A. 

Considere agora um sistema SISO, estritamente próprio, que tem a seguinte repre- 


sentação em função de transferência: 


G(z) = Y(z) _ be-12 71 + bp_oz¥-? +... + bız + bo 
U(z) 2 + apt +... Ot +0 
bk—12 7! + bp 22 2 +... + biz tt + boz” 


= E 8.58 
1+ ag-z! +... + arz EH + agz—* ( ) 
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A forma canônica controlável pode ser obtida diretamente dessa representação ao 


definir, por exemplo, V(z) = m Assim, 
V(z) = U(z) — ari V (z) — ... — aiz PV (z) — aoz" V (z) 
=> v[n] = ujn] — az-1v[n— 1] —... — azu[n— k +1] — agv[n — k], (8.59) 
e 
Y (2) = bg_1z7!V(z) +dx-22 2V(2) +... + biz FIV (z) + boz *V(z) 
> y[n] = by-¿v[n— 1] + bk-2v[n — 2] +... + biv[n — k +1] + bov[n — k]. 
(8.60) 
Define-se roi [n] = v[n— k], 2ca[n] = v[n— k +1], ..., ecx[n] = v[n — 1], de tal modo 
T 
que xc[n] = [vin =k] vjn-k+1] ... vijn- 1] . Assim, chega-se ao diagrama da 
Figura 8.4. 


Figura 8.4 — Diagrama de blocos de um sistema SISO estritamente próprio 
na forma canônica controlável. Note que, com abuso na notação, 


considerou-se v[n — 1] = 2 lv[n]. 


Tal esquema equivale à representação em (8.52)-(8.53) com 8; = bj, i= 1, 2,..., k. 
Para um sistema bipróprio da forma 


Y(2)  de2F+by 121 + dy_oz*®-2 +... + biz + dp 
~ U(z) - ze 4 ap 121 +... + az +a 4 


(8.61) 
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note que 
DA hdp hal by 2 po dz +o [2h Y ag 2:14 ay_geh2 +. 12 tao 
(trap 12 popa 9272 +-:**+bxa12+ brao) bk 


(bk—1 — bpag-1)2 71 + (bk—2 — bpap-o)z6 24... 
(bı — bkaı)z + (bo — bkao) 


ou seja, 


(0% 1 — bpap-s)28 71 + (bk2 — bpap-2)282 + (by — bkar)z + (bo — brao) 


G = bx + 8.62 
(2) = bi zk + ap_yzk-1+...+a1z+ 40 (8:62) 


Portanto, para esse caso, na Figura 8.4 o termo bķ—i deve ser substituído por 
(bk-i — bkap-i), à = 1, 2,..., k, e deve-se somar o termo direto (bpufn]) em yfn]. 
Na representação em espaço de estados apresentada em (8.52)-(8.53), isso equivale a 
fazer 8; = (bk—i — bkak—i) e D = bp. 

Como será visto mais adiante, a forma canônica controlável facilita muito o projeto 


do controlador por alocação de polos via realimentação linear de estados. 


8.5.2 Forma canônica observável 


A forma canônica observável para um sistema SISO pode ser dada por 


0 0 —ao Bo 
100 —a Bi 
0 1 0 42 Ba 
xoln +1] = xo[n] + ujn], (8.63) 
000 
000 0 —ak-2 Br-2 
0 0 0 1 -—ap-ma Br-1 
Po To 
vin]=[0 0 ... 1] xoln] + Duln). (8.64) 
Ee 


Define-se W = T”!. Assim, xo[n] = Wx[n], Po = WPW"!e Co = CW. 


Para encontrar a matriz W, considere que ela tenha a seguinte estrutura: 


W=T1=| 7 |. (8.65) 
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Note que 
CoW=C= wz =C, (8.66) 


ou seja, a última linha de W é a matriz de saída. Para determinar as demais linhas, 


considere a relação Po = WBW”!, tal que 


doW = Wọ 
0 0 - 0 —ao wi wi 
1 00 - 0 —a Wo wo 6 
0. 10 - 0 —02 W3 w3®P 
= i . (8.67) 
0 0 1 : 
0 0 Q 0 —Qk=2 Wk-1 wp-1P 
0 0 Y as 1 —QAk-1 Wk wre 


Ao comparar linha a linha os termos da igualdade (8.67), partindo da última até a 


segunda linha, verifica-se que 


WkỌ = Wk—-1 — ak-1Wk > wx-1=C%+az-¡C, 


Wk—1® = Wk—2 — ap OW; > Wķk—2 = CH + ax-1C9 + ak-2C, 


wo® = w; — 41 W; > 
w1 = CB*71 + ay ¡CO 2 + a, 90034... + 4308? + 0909 + 01C. 


(8.68) 
Nota-se, portanto, que a matriz W possui a seguinte forma: 
ay as as ce Ga 1 C 
az a3 : ee il, 0 Co 
E CS? 
w=| % 0-1 EA (8.69) 
: Ak-—1 1 E ` 
k-2 
a 1 ý q w| Er 
k-1 
1 O dae & ol 
— O 


Como será visto posteriormente, O em (8.68) representa a matriz de observabilidade 
do sistema (8.50)-(8.51). Caso o sistema seja observável (conceito a ser visto na seção 
8.7), a matriz O admite inversa. Portanto, para transformar um dado sistema como em 
(8.50)-(8.51) para sua forma observável, utiliza-se T = W~! = (TO). 
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Considere novamente a representação em função de transferência para um sistema 
estritamente próprio da Equação (8.58). A forma canônica observável também pode ser 


obtida diretamente dessa representação ao notar que 


¥(z) = (apar (2) +br-1U(2)) +2" (apar (2) + br-2U(2)) +... + 
z** (—aY (z) + bU(z)) + 2* (—aoY (2) + boU(z)). (8.70) 


Tal equação é representada no diagrama de blocos da Figura 8.5. 


uln] 


Figura 8.5 — Diagrama de blocos de um sistema SISO estritamente próprio na 
forma canónica observável. Novamente, abusou-se da notacáo ao 


considerar xo;[n] = z~!xo;[n + 1]. 


Isso é equivalente a (8.63)-(8.64) com 8; = b;, i = 1, 2, ..., k. Para um sistema 
bipróprio, no diagrama da Figura 8.5, o termo by; deve ser substituído por (bk-; — 
brap-i),i = 1, 2, ..., ke deve-se somar o termo direto (byu[n]) em y[n]. Na representação 
em espaço apresentada em (8.63)-(8.64), isso equivale a fazer 8; = (bx; — bkGk-i) e 
D = bp: 

Como será visto adiante, a forma canônica observável facilita muito o projeto de 


observadores por alocação de polos. 


8.5.3 Forma canônica diagonal 


Se o sistema representado em (8.50)-(8.51) possuir autovalores reais distintos, 
A1, A2,..., Ax, então os autovetores correspondentes ey, es», ..., ez serão linearmente 


independentes. Define-se então a matriz T = E, tal que 


E= |e: css er] - (8.71) 
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Assim, 
AM 0 0 
© dp ss Ü 
E'®E=| |. (8.72) 
CO O ss Ak 
E ama 
A 


Portanto, ao definir x[n] = E xp[n], verifica-se que dp = A = E!E, Tp = E*T 


e Cp = CE, resultando na seguinte forma diagonal: 


Az 0 0 a 
0 As Sonia as 
xpint+ l=]. o | xpin] +]. | unl, (8.73) 
0 0 Nk ak 
Pp Tp 
yin] = [rr rz... re] xpln]+ Dulnl. (8.74) 
ee 
Cp 


Logo, para transformar o sistema (8.50)-(8.51), com autovalores reais distintos, para 
sua forma diagonal, utiliza-se T = E, em que E é a matriz cujas colunas são os autovetores 


da matriz & do sistema original. 


Caso a função de transferência em (8.58) possua k autovalores reais distintos, ela 
pode ser reescrita da seguinte forma: 
Y (2) ry Ta Tk 


Assim, tem-se o diagrama em blocos equivalente da Figura 8.6. A representação 
em espaço de estados apresentada em (8.73)-(8.74) é facilmente construída considerando 
que os estados são as saídas dos blocos de atraso unitário. Para sistemas estritamente 
próprios, D = 0. 

Se o sistema for bipróprio, deve-se somar o termo direto byu[n] na saída. Nesse caso, 


na representação em espaço de estados, tem-se D = bz. 


Caso o sistema tenha autovalores com multiplicidade, tem-se a forma canônica de 


Jordan, em que a matriz & é transformada para uma forma bloco diagonal, com o seguinte 
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u[n] anil? PI 2, ln] yn] 


Figura 8.6 — Diagrama de blocos de um sistema SISO estritamente próprio na 


forma canônica diagonal. 


aspecto: 
Ay 1 0 
0 A 1 0 
0 0 A 
j = Aa 1 a (8.76) 
0 AM 
Ag 
0 7 


Às 


Nesse caso em particular, os autovalores da matriz $ são dados por 
Ai, Ai, Az, As, As, Ag, A7, As. Para maiores detalhes sobre a forma canónica de Jordan 


e sobre outras formas canônicas, sugere-se a leitura de [Kailath 1980]. 


8.6 Estabilidade segundo Lyapunov 


Uma forma de verificar a estabilidade do sistema é através do método de Lyapunov. 


Em particular, será considerado o segundo método de Lyapunov, o qual é bastante utili- 
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zado na análise e síntese de controladores não lineares, mas que também pode ser utilizado 
na análise de sistemas lineares. Aqui será apresentada a versão para sistemas LIT de 
tempo discreto. Para isso, V(x) será substituída por AV (x[n]) = V (x[n + 1]) — V(x[n]), 
em que V(x) é denominada função candidata de Lyapunov. 

No caso geral em tempo contínuo, a estabilidade segundo Lyapunov é definida pelo 


teorema a seguir: 
Teorema 8.6.1 Seja um sistema descrito por 
x = fi), (8.77) 
€ Xeg € Y um ponto de equilíbrio. Se existir uma função V(x): ¥ > R, tal que 
e V(x) >0, 
° V (x) <0, 
em torno do ponto Xeq, então esse ponto de equilíbrio é estável. Se V(x) < 0, entao o 


ponto de equilíbrio é assintoticamente estável. 


Aqui, estável significa que, se a trajetória dos estados iniciar suficientemente perto do 
ponto de equilíbrio estável, os estados permanecem para sempre tão próximos do ponto 
de equilíbrio quanto se queira. Por outro lado, assintoticamente estável significa que, 
adicionalmente, a trajetória converge para o ponto de equilíbrio à medida que o tempo 
passa. 

Para sistemas LIT, o segundo método de Lyapunov garante condições necessárias e 
suficientes para estabilidade. 


Particularmente, para sistemas discretos representados por 
x[n + 1] = Bx[n), (8.78) 
define-se V (x[n]) = x! [n] P x[n], com P = P' > 0. Assim: 
AV(x) = V(x[n+1]) — V(x[n]) 

= xn+1]Pxin+1]-x"[n]Pxin] 

= x! [nj@! P x[n] — x! [n] P x[n] 

= x! [n(9! PS — P)x[n] 

= -x' [n]Qx[n], (8.79) 
em que Q = —(@' P® — P). Como AV(x) precisa ser definida negativa, então, para a 


estabilidade assintótica é necessário e suficiente que Q > 0. Portanto, para sistemas LIT 


em tempo discreto o Teorema 8.6.1 é equivalentemente escrito como: 
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Teorema 8.6.2 O sistema em (8.78) será assintoticamente estável se e somente se, para 


qualquer matriz Q =Q' >0, a equação de Lyapunov 
$'P9-P=-Q (8.80) 


apresentar uma solução única P = P! > 0. 
Pode-se, por exemplo, escolher Q = I e resolver (8.80) para P. Caso a solução 
seja encontrada com P = P! > 0, então o sistema é assintoticamente estável. No 


MATLAB®, a funcáo P = dlyap(A,Q) resolve a equacáo discreta de Lyapunov. 


P>0 
E 8.81 
E A met 


Note que 


representa um sistema com desigualdades lineares matriciais, o que na literatura de con- 
trole é bem conhecido pela sigla em inglés LMI (Linear Matrix Inequality). Utilizando o 


complemento de Schur?, as LMIs em questão podem ser reescritas da seguinte forma: 


(8.82) 


P o'P é 
PS P ` 


Estabilidade segundo Lyapunov é exercitada no Exemplo 8.3. 


20 complemento de Schur é uma relação de uma submatriz com as demais resultantes 


A B 
da mesma partição. Dada uma matriz M = a eal? o complemento de Schur da 


submatriz D é dado por A— BD7!C. 
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8.7 Controlabilidade e observabilidade 


Os conceitos de controlabilidade e observabilidade possuem um papel importante no 
projeto de sistemas de controle no espaço de estados. 


e Controlabilidade: considere o sistema descrito pela seguinte equação de estados: 


x[n + 1] = ®x[n] + Tu[n). (8.88) 


Assume-se que u[n] é constante paranT, < t < (n + 1) T. 

Tal sistema será dito controlável se, para qualquer instante inicial n = 0, existir uma 
entrada u[n], n = 0, 1, 2,...,4 — 1, que transfira o sistema do estado inicial x[0] para 
qualquer estado desejado x[k] em um intervalo de k amostras. 


Para um sistema ser completamente controlável, a matriz (k x kr) 
c=[r | or |. | er], (8.89) 


deve possuir posto (rank) igual a k, ou seja, as colunas de C devem ser linearmente 


independentes. Tal matriz é denominada matriz de controlabilidade. 


Isso pode ser demonstrado considerando a equação de estados (8.88) escrita de forma 
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recursiva de n = 1 a n = k, ou seja, 


x[1] = x[0] + Pu[o]. 

x[2] = S(8x[0] + Tu[0]) + Tu[1] = &?x(0] + STu[0] + rul], 

x[3] = S*%x[0] + Tuo] + rull] + Pu[2), 

x[k] = S*x[0] + 6*1Tul0] + Tull] +... + STu[k — 2] + Pulk — 1). 


Na forma matricial, tem-se, 


u[k — 1] 
u[k — 2] 
x(k] =8'x[0) + [r or sr... ær] julk—3]). (8.90) 
e Y 
ulo] 


Observe que a matriz C tem dimensao k x kr. Assim, para que ela tenha solucáo, 
posto(C) = k, (8.91) 


o que garante a existéncia de uma sequéncia de acóes de controle capaz de transferir o 
sistema do estado inicial para um estado desejado após k períodos de amostragem. 

Pelo teorema de Cayley-Hamilton verifica-se que, para n > (k — 1), as próximas 
colunas de C são linearmente dependentes dos termos anteriores e, portanto, eles não 
alteram o posto da matriz C. 

No MATLAB®, Co = ctrb(Phi,Gamma) obtém a matriz de controlabilidade Co do 


par (Phi, Gamma), e rank(Co) verifica o posto da matriz. 

e Observabilidade: Considere agora a seguinte representação: 
x[n + 1] = Bx[n), (8.92) 
y [n] = Cx[n]. (8.93) 
Tal sistema é dito completamente observável se todo estado inicial x[0] puder ser 
determinado pela observação da saída y[n] e da entrada u[n] durante um número finito 
de períodos de amostragem (0 < n < k—1), dado que o modelo do sistema seja conhecido. 
Em outras palavras, o sistema é completamente observável se toda transição de estados 


afeta todos os elementos do vetor de saída. Pode-se mostrar que o posto da matriz 
(km x k) 
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Co 
—— |. (8.94) 
Co 
deve ser k, ou seja, rank(O) = k. A matriz O é denominada matriz de observabilidade. 


A prova de observabilidade é semelhante à de controlabilidade. Considere as Equa- 
ções (8.92) e (8.93), escritas den = 0 até n = k — 1, tal que 


ylo) = Cx[0], 
yll] = Cx[1] = C(®x[0] + Tul0]), 
y2] = Cx[2] = C(S*x[0] + &T'u[0] + Tu[1)), 
y[3] = Cx[3] = C(®%x(0] + $?Tu[0] + STu[1] + Pu[2)), 
ylk-1] = C(8* 1x0] + 9*-?rujo] + 9*3Tu[1] + --- + TPu[k — 1]). 


Na forma matricial, tem-se: 


y [0] C 0 0 u|0] 
y [1] Co Cr 0 u[1] 
y[2] | =| cC? |x[0)+ | Cor cr 0 u/2] 
y[k — 1] Ca cer carr ... CT 0| |ulk-1] 
— [e 
O 
(8.95) 


Note que a matriz O tem dimensáo mk x k. Portanto, para que ela tenha solucáo, 
posto(O) = k. (8.96) 


Se tal condicáo for satisfeita, entáo o estado inicial x[0] pode ser reconstruído a partir 
de u[0] a u[k — 1] e da observação de y[0] a y[k — 1], juntamente com o conhecimento 
do modelo (matrizes $, T e C). Com x[0] reconstruído, os demais estados podem ser 
reconstruídos a partir de (8.30). 

Assim como na controlabilidade, pelo teorema de Cayley-Hamilton é possível mostrar 
que, para n > (k — 1), os próximos termos da equação são linearmente dependentes dos 


termos passados e, portanto, eles não são acrescentados na equação. 
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Tem-se uma interpretação muito importante do resultado anterior: se o sistema 
não for observável com k medidas de saída, então ele também não será observável com 
n > k medidas, ou seja, não adianta coletar mais dados das mesmas saídas para tentar 


reconstruir os estados do sistema. Isso pode ajudar a amenizar efeitos de ruídos de 


medição, mas não altera a observabilidade do sistema. 

No MATLAB®, Ob = obsv(Phi,C) obtém a matriz de observabilidade Ob do par 
(Phi, C), e rank(0b) retorna o posto da matriz. 

As condições de controlabilidade e observabilidade são testadas no Exemplo 8.4. 


Os conceitos de controlabilidade e observabilidade são muito importantes para o es- 
tudo de controle. Caso se deseje impor todos os polos de um sistema através de uma 
realimentação de estados, por exemplo, ele precisa ser completamente controlável. Po- 


rém, é possível que um sistema não seja totalmente controlável, mas que sua parte não 
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controlavel seja estavel. Isso define uma nova condigao do sistema chamada estabilizabi- 
lidade, ou seja, tal sistema é estabilizavel. 

O mesmo é valido para observabilidade. Se um sistema nao for totalmente observável, 
mas tem sua parte não observável como estável, tem-se a propriedade de detectabilidade, 
ou seja, o sistema é detectável. 

É possível separar a parte controlável da não controlável e, assim, verificar se o sis- 


tema é estabilizável (o mesmo pode ser feito para observabilidade e detectabilidade). Para 


isso, basta aplicar uma transformação de similaridade ao sistema, tal que x[n] = Tx[n], 
ou seja, 

xin+1] = T/&Tzx[n]+ TTujn], (8.99) 

yin) = CTX[n]. (8.100) 


A matriz T é formada pelos vetores colunas linearmente independentes (LI) da matriz 
de controlabilidade e completada com vetores LIs arbitrários. O número de vetores que 
devem ser completados é a dimensão do espaço nulo da matriz de controlabilidade. A 


transformação resulta nas seguintes matrizes: 


P 9 
TƏT = i ag K (8.101) 
ne 
r. 
Tr = | (8.102) 


A parcela formada por ®,, ®j2 e T. corresponde à parte controlável, enquanto Pc 
é a parte não controlável. 

Assim, para saber se o sistema é estabilizável, basta verificar se autovalores de Pc 
estão dentro do círculo unitário. Com essa mudança de base, pode-se efetuar o projeto 
do controlador considerando apenas a parte controlável e, em seguida, transformar o 
controlador de volta para a base original. O conceito de estabilizabilidade é visto no 


Exemplo 8.5. 


£ Exemplo 8.5: Considere o sistema dado por 


0,75 —0,25 4 1 2 
x[n+1) = 225 =075 0 |) eile ]-2 2) aan. (8.103) 
-0,375 0,125 3,5 a 


Verifique se ele é controlável. Se não for, verificar a estabilizabilidade. 
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8.8 Zeros na representação em espaço de estados 


Diferentemente do caso SISO, em que o zero é determinado como as raízes do nu- 
merador da função de transferência, para sistemas MIMO a função não é um escalar e, 
portanto, não se pode definir zeros para um par entrada-saída individualmente. 

Considere uma realização mínima de um sistema G(z) com r entradas e m saídas”. 
Os zeros z = zo são os valores que fazem com que G(z) tenha posto deficiente, ou seja, 


os valores de zp que satisfazem qualquer uma das duas equações: 


G(z0) Vin = 0, Vig A 0, (8.107) 
Vout G(20) =0, Vout 40, (8.108) 


em que Vin e Vout são denominados direção de entrada e direção de saída do zero. 


3Uma realizacao é dita minima se ela é descrita pelo menor número possível de estados. 
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Considere, por exemplo, (8.107) para uma entrada Vin = V, tal que a resposta do 


estado para essa entrada seja dada por xy. De (8.39), verifica-se que 


G(xw)V = Clyl-6)!rV+DV=0 
= CX, +DV=0. (8.109) 
em que 
X, = (I — 6) Tv. (8.110) 


Na forma matricial, de (8.109) e (8.110), verifica-se que 


(at= D le = A (8.111) 
c D|Iv| lo 
Ro 


Nesse caso, os zeros são os valores de z = zp para os quais a matriz Ro, denominada 
matriz de Rosenbrock, perde posto. Isso resulta em saída zero para alguma entrada 
V #0. Tais zeros também são denominados zeros invariantes pois, como será visto 
adiante, eles são invariantes a uma realimentação de estados. 

Para uma realização mínima, os zeros são denominados zeros de transmissão (ZT). 
Para uma realização não mínima, podem aparecer zeros adicionais, a saber, zeros de 
desacoplamento da entrada (ZDE) e zeros de desacoplamento da saída (ZDS). Com isso, 


os zeros do sistema são dados por 
Zeros do Sistema = ZT U ZDE U ZDS — ZDE/S, (8.112) 


em que ZDE/S representam os zeros que sao ambos ZDE e ZDS. 


Os zeros de desacoplamento da entrada são os z = 2p para os quais a matriz 
[(ot-%) =r] (8.113) 


perde posto. Por outro lado, os zeros de desacoplamento da saída sao os z = zo para os 
quais a matriz 
(zol = $) 


a (8.114) 


perde posto. De forma equivalente, a parcela de autovalores de ® que corresponde aos 
modos não controláveis ou não observáveis são chamados de zeros de desacoplamento da 
entrada ou saída, respectivamente. 

No MATLAB® para encontrar os zeros invariantes de um sistema SISO ou MIMO 
denotado por sys, pode-se utilizar a função tzero(sys). Para uma realização mínima, 


isso corresponde aos zeros de transmissão. 
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Os Exemplos 8.6 e 8.7 mostram como calcular os zeros de um sistema SISO e outro 


MIMO, respectivamente. 
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AOS ZERO) ors 

posto_Ro2 = rank([z_02*eye(3)-A -B; C D]); 
posto_R_in2 = rank([z_02*eye(3)-A -B]); 
posto_R_out2 = rank([z_02*eye(3)-A; C]); 


Os zeros obtidos a partir de (8.111) são invariantes a uma transformação de similari- 
dade. Para verificar isso, considere a transformação x[n] = Tx[n], sendo T não singular. 


Com isso, a nova representação em espaço de estados é dada por 


x[n +1] = T 1 ®TX[n] + T-*Tuln], 
y[n] = CTx[n] + Dufn]. (8.115) 


Assim, o sistema matricial de Rosenbrock é dado por 


Xy| 0 
E Pm. 


(al -T0D) «TE 
CT D 


que pode ser reescrito como 


T- o0] [o1-8) -r| fr o 0 
ta ls |. (8.117) 
o I c D|lo il|lv| lo 
A 
Ro 


Como a matriz T é não singular, as matrizes que multiplicar Ro à esquerda e a 
direita sáo náo singulares e, portanto, a matriz de Rosenbrock do sistema transformado 
só perde posto se a do sistema original perder. Assim, tais zeros sao invariantes a uma 


transformação de similaridade. 


8.9 Controle por realimentação de estados 
Considere o sistema representado por 


xin+1] = Sx[n] + Tuln], (8.118) 
yin] = Cxín]. (8.119) 


Ao invés de realimentar a saída, que tal utilizar a realimentacáo das variáveis de 


estado? 
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Se o sistema for controlável, é possível determinar uma matriz de ganhos K (r x k) de 
realimentação de estados, tal que a lei de controle u = —Kx garanta alocação arbitrária 


dos polos do sistema em malha fechada. O sistema em malha fechada é descrito como 
x[n + 1] = x[n] — TKx[n] = (® — TK)x[n]. (8.120) 


A Figura 8.7 ilustra a representação em espaço de estados em malha fechada. A 


equação característica do sistema descrito em (8.120) é dada por 
det (21- 9 +TK) = 0, (8.121) 
em que a posicáo desejada dos polos de malha fechada é conhecida, tal que 


Pelz) = (2— pr) (z — p2) ++- (z — Pr) - (8.122) 


Figura 8.7 — Controle com realimentação de estados. 


A realimentação de estados resulta em um sistema em malha fechada descrito por 


x[n + 1] = ($ —TK) x[n], (8.123) 
— 
BMF 
em que os polos sao os autovalores da matriz de estado em malha fechada ® mp. Se o 


par (®, T) for completamente controlável, então existe K, tal que 
det (zI — $ + TK) = p,(z), (8.124) 


para qualquer polinômio pe(z) de grau k especificado. 

No MATLAB®, para sistemas SISO, o comando acker pode ser utilizado para en- 
contrar a matriz de realimentação de estados, com a seguinte sintaxe: 
K = acker(Phi, Gamma, p_c). Tal método apresenta resultado satisfatório para siste- 
mas de ordem menor ou igual a 10, é capaz de alocar polos com multiplicidade, mas não 


se aplica a sistemas MIMO. 
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Por outro lado, o comando place pode ser utilizado satisfatoriamente para sistemas 
MIMO, como a mesma sintaxe do comando acker. No entanto, não é capaz de alocar 
polos com multiplicidade maior do que o posto de T. 

Se um sistema SISO estiver em sua forma canônica controlável, o projeto por alocação 
de polos é trivial. Para verificar isso, considere, sem perda de generalidade, um sistema 
de ordem 3 na forma 


x[n + 1] = x[n] + Tulnl, (8.125) 


cuja forma canônica controlável é dada por: 


0 1 0 0 
xcln+1]=| 0 0 1 | xc[n] + |0| uln]. (8.126) 
—ag -GI Qð 1 
Note que x[n] = Txc[n]. Em malha fechada, na forma canónica controlável com 


ganho de realimentação de estados Kc = [kco koa kes] , tem-se 


0 1 0 
xc[n+1]=(Bc0-TcKo)xc[n]= 0 0 1 xc[n]. 
=(a0 +kco) —la1 +kcı) —(a2 + kee) 
(8.127) 
Deseja-se fazer 
det (21 — Bco +TcKc) = 2? +242 + zq + 40, (8.128) 


em que q2, q1 € qo são os coeficientes da equação característica em malha fechada desejada, 


ou seja, de (z — p1) - (z — pa) - (z — p3) = 0. Com isso, 


2 + 27(a2 + kc2) + 2(a1 + kc1) + (ao + kco) = 2° + 22qo + zq + qo. (8.129) 
Portanto, 

Kc = [kco ko kea| = [ão -ao qQ- Q- a| . (8.130) 

Como u[n] = —Kcxc[n] = KcT~!x{n] = Kx[n], para voltar o ganho de realimen- 


tação de estados para a base original, basta que se faça K = KgT”!. Tal procedimento 


de imposição de polos é aplicado no Exemplo 8.8. 
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8.9.1 Invariáncia dos zeros a realimentação de estados 


Como visto, caso o sistema seja completamente controlável, a posição dos polos de 
malha fechada pode ser arbitrariamente imposta por uma realimentação de estados. No 
entanto, nada pode ser feito em relação aos zeros do sistema. Para verificar isso, considere 


o sistema das equações (8.7)-(8.8), mas agora em malha fechada, com uma lei de controle 
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dada por u[n] = —Kx[n] + v[n]. Assim, 
x[n+1) = (9-TK)x[n]+ PvÍn), (8.131) 
yin] = (C-DK)x[n] + Dv[n]. (8.132) 


O sistema matricial de Rosenbrock é dado por 


(zI — B+TK) a] | X (20) | = A (8.133) 
C-DK D | |V(z)+KX(20) 


que, expandido, pode ser reescrito 


de — PX (20) + TKX) -TV(20) — lil o A gij 
CX(20) — DKX(%) + DV (z) + DKX(%) UN l 


Com as simplificações efetuadas, a Equação (8.134) pode ser reescrita como 


(zol — 8) a] a o A . (8.135) 
C D | |V(z) 0 


que equivale à Equação (8.111), ou seja, os zeros são invariantes a uma realimentação de 


estados. 


8.10 Projeto de observadores de estado 


O projeto do controlador necessita de acesso às variáveis de estado para realizar a 
realimentação com os ganhos obtidos. O acesso a tais variáveis pode ser feito através de 
sensores. Entretanto, em alguns casos, a medição de alguns estados é impraticável por 
motivos como custo do sensor, inviabilidade física ou mesmo pelo fato de um dado estado 
não ser explicitamente disponível para medição. 

Na impossibilidade de realimentar os estados reais, a ideia é fazer u = —Kx, onde x 
representa uma estimativa dos estados. Considere novamente a representação em (8.118)- 
(8.119), onde ®, T e C são conhecidas. Se o sistema for observável, as estimativas de 
estado podem ser obtidas conhecendo-se o modelo do sistema, suas entradas e suas saídas. 
O observador, denominado observador de Luenberger, é projetado por alocação de polos, 


de forma similar ao controle por realimentação de estados. 


8.10.1 Observador preditor 


Considere a representação da Figura 8.8. 


208 Controle Digital Aplicado 


ul] 


Figura 8.8 — Diagrama do estimador preditor em malha aberta. 


Note que, dessa forma, o estimador nao esta utilizando qualquer medida do sistema 
real, o que pode fazer com que a estimativa divirja do valor desejado. Para corrigir o erro 
de estimação, pode-se utilizar uma realimentação deste erro, como mostrado na Figura 
8.9, onde L (k x m). 


| 
| 
| 
i 
| 
¡Modelo 


Figura 8.9 — Diagrama do estimador preditor em malha fechada. 


Da Figura 8.9, a equação do estimador é dada por 


xin+1] = Sx[n] + Tu[n] + L(y[n] — y [n]) 
$x[n] + Tu[n] + LC(x[n] — x[n]). (8.136) 


II 


Ao definir x[n] = x[n] — x[n], tem-se 


X[n + 1] 


x[n + 1] — &[n + 1] = 9(x[n] — x[n]) — LCx[n] 
= (6 — LC)X[n]). (8.137) 


Se o sistema for completamente observável, então existe L tal que 
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det (¡1 — ® + LC) = polz), para qualquer polinômio po(z) de grau n es- 
pecificado, ou seja, pode-se dar a x[n] o desempenho desejado. Em geral, deseja-se 
que x[n] convirja rapidamente para zero. Note que o erro de estimação depende dos 
autovalores de ($ — LC). Portanto, se esses autovalores são estáveis, o erro tende a 
zero assintoticamente. É importante notar que os polos do observador devem possuir 
dinâmica mais rápida que os do sistema de controle em malha fechada, para que a 
convergência seja relativamente rápida. Entretanto, quanto mais rápido for o observador, 
maior será o efeito nocivo de amplificação de ruídos de medição. 
Note que o projeto do observador consiste em resolver o problema de alocação de 
polos para o sistema 
z[n +1] = 8 'z[n] + C' vin], (8.138) 


pois os autovalores de (®' — CTL!) são os mesmos de ($ — LC). Assim como no 
problema de controle por alocação de polos, pode-se também utilizar o comando place 
do MATLAB®, com a seguinte sintaxe: L = place(Phi', C',p_o)', sendo Phi, C as 
matrizes de estado e de saída, e p_o o vetor com a posição desejada dos polos. 

Tal esquema é denominado observador preditor, pois utiliza a medida da saída atual 
para estimar o estado um período à frente. 

Se um sistema SISO estiver em sua forma canônica observável, o projeto do observa- 
dor também é trivial. Novamente, sem perda de generalidade, considere um sistema de 
ordem 3 na forma 

x[n + 1] = 9x[n] + Tuln], (8.139) 


cuja forma canônica observável é dada por 


O O cú bs 

xo[n+1] = 11 a | Xo[n] + |b: | un], (8.140) 
O 1 —a2 bo 

yin] = jo 0 1] xo[n]. (8.141) 


Note que x[n] = Txo[n]. Com o observador em malha fechada e assumindo a forma 


= 
canônica observável com ganho de realimentação de estados Lo = [too loi tos] a 


tem-se o erro de estimação dado por 
Xo[n + 1] = (Bo = LoCo)Xo[n]. (8.142) 
Deseja-se fazer 


det (zI — bo + LoCo) = 2% + 2292 + 2q1 + qo, (8.143) 
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em que q2, q1 € qo são os coeficientes da equação característica em malha fechada desejada 
para o observador, ou seja, de (z — pi) - (z — p2) -(z — p3) = 0. Com isso, 
z? + 2º(a2 + Lo2) + 2(a1 + £01) + (ao + Loo) = 2? + 22q + 2M + qo. (8.144) 
Portanto, 
T $ 
Lo = [too tor to] = [ao = dima @- as | - (8.145) 
Como Wx[n] = xo [nl], então, Wx[n + 1] = (Bo — LoCo)Wx[n]. Assim, 


(W1iboW — W"*L¿CoW)x[n] 
($ — LC)X[n]. (8.146) 


k[n + 1] 


Portanto, para voltar Lo para a base original, deve-se fazer L = W~!Lo = TLo. 


Tal procedimento é aplicado no Exemplo 8.9. 


Controle Digital por Variáveis de Estado 211 


8.10.2 Observador pelo valor atual 


Pode-se projetar um estimador no instante n para uma medida de saída no instante 


n, diferente do estimador mostrado anteriormente, de tal forma que 
&[n] = X[n] + Le(y[n] — Cx[n]), (8.147) 


onde x[n] é dado por 


x[n] = 8% Ín — 1] + Tuín — 1). (8.148) 
Ao substituir (8.147) em (8.148), verifica-se que 
%[n] = S&[n — 1] + Puín — 1] + L.C(x[n] — Xn]). (8.149) 
Como 
x[n] — x(n] =(Sx(n — 1] + Tuín — 1)) — (B&[n — 1] + Puln — 1))=8%n— 1], (8.150) 


tem-se que 


X[n] = 9x[n — 1] + Tul[n — 1] + L-C®x[n — 1]. (8.151) 
Logo, o erro de estimação possui a seguinte dinámica: 
x[n] = x[n] — x[n] = (9 — L¿C9) x[n — 1]. (8.152) 


Ao tomar a transposta de ($ — L.C®), tem-se (6! = e OL Portanto, a ma- 
triz de ganhos do estimador pode ser encontrada utilizando-se o comando place do 
MATLAB®, com a seguinte sintaxe: L = place(Phi', Phi' C', p_o)', sendo Phi, Cas 
matrizes de estado e de saída, e p_o o vetor com a posição dos polos desejada. 

A Figura 8.10 ilustra o diagrama em blocos do sistema com realimentacáo de estados 


utilizando o estimador do valor atual. 


8.10.3 Sistemas com perturbacoes 


Considere o sistema da Figura 8.11. Suponha que ele seja afetado por uma pertur- 


bação w(t), cujo modelo é dado por 


Gib) = At), (8.153) 
w(t) = Colt): (8.154) 
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Figura 8.10 — Diagrama do estimador de valor atual com o controle em malha 
fechada. 


Planta 


Figura 8.11 — Sistema com cancelamento de perturbação modelada. 
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Se w(t) for constante, então Aw = C,, = I. O sistema aumentado pode ser repre- 


ei 
Xu (t) 


y(t) = jc o] bed : (8.156) 


sentado como 


B 
0 


A BC, 
0 Aw 


x(t) 


ia u(t), (8.155) 


— 


O equivalente discreto desse sistema é dado por 


e E =y is +T,,uln], (8.157) 
y [n] = [c o] ae (8.158) 


O ganho de realimentação de estados K é obtido a partir de $ e T não aumentados. 
O par ($, P,,) não é controlável. A intenção não é controlar w[n], apenas rejeitá-la. 

Pode-se projetar um observador em tempo discreto que, além de observar os estados 
que serão realimentados, possa estimar a perturbação modelada, w[n], e cancelá-la da 
entrada da planta. Portanto, para o cálculo do ganho do estimador L, é necessário utilizar 
as matrizes aumentadas PB, e Tw. 


O diagrama de blocos em tempo discreto equivalente é apresentado na Figura 8.12. 


Figura 8.12 — Sistema em tempo discreto com cancelamento de perturbação mo- 


delada. 


Desta forma, pode-se estimar o modelo de perturbação e subtrair da entrada a per- 
turbação estimada. Vale mencionar que essa técnica só é válida para uma perturbação 


modelada. 
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8.11 Principio da separação 
Considere o sistema com um observador de estado, como mostrado na Figura 8.9, 


e também uma realimentacáo de estados da forma u[n] = —Kx[n]. A equação que 


representa esse sistema em malha fechada é dada por 


E eg | eee (8.159) 
LC $-LC-TK| |x{n] 


x[n + 1] 
x[n + 1] 


Esse modelo descreve a dinâmica do estado real x[n] e a do estado estimado x[n]. 


Como visto anteriormente, o erro de estimação é definido como X[n] = x[n] — x[n). 
Ao realizar uma mudança de base em (8.159) de tal forma que seja considerado o erro 


de estimação no lugar do estado estimado, resulta em 


$-TK TK 
0 $-LC 


at | (8.160) 


Observe que os autovalores do sistema são dados pela união com repetição dos autova- 
lores de ($ — T K) com os autovalores de ($ — LC), ou seja, dos polos da realimentação 
de estados e do observador. Com isso, conclui-se que a realimentação de estados e o 
observador podem ser projetados separadamente. Essa condição define o Princípio da 
Separação. 

Como regra geral, os polos de (® — LC) devem possuir módulo inferior ao módulo 
dos polos de ($ — TK). Isso garante que a dinâmica do observador de estados seja mais 


rápida que a do controlador. 


8.12 Problema de rastreamento 


Esquemas como o da Figura 8.7 são reguladores que levam o estado do sistema 
a zero a partir de qualquer condição inicial, com velocidade determinada pela equação 
característica do sistema em mala fechada. No entanto, caso as saídas do sistema precisem 
seguir uma referência com erro assintótico nulo (problema rastreamento), não se pode 
garantir a ausência de erro em regime pela realimentação de estados. Duas formas serão 


vistas para tratar o problema de rastreamento. 
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8.12.1 Realimentacao de estados com entrada de referência 
e pré-filtro 


Considere o diagrama em blocos da Figura 8.13, e que o sistema possua o mesmo 


número de entradas e saídas, r[n] € R™*!, y[n] € R™*?. 


Figura 8.13 — Realimentação de estados com entrada de referência e ajuste de 


ganho. 


A alocação de polos geralmente altera o ganho total do sistema, o que sugere o uso 
de um pré-filtro, que é na verdade um ganho, para ajustar saída quando há uma variação 
degrau na referência. Na Figura 8.13 o pré-filtro é representado por F (m xm). O 
sistema em malha fechada é regido por 

xn+1] = (®-TK)x[n] +P Frinl, (8.161) 
y = Cx: (8.162) 


Na condigao de regime permanente, tem-se 


Xss = (® —TK)x,, +TFrss, (8.163) 
Yss = CXss. (8.164) 
Reescrevendo (8.163), segue que 
Xss = (Ip — 6 + TK) 'TFrs,, (8.165) 
e, portanto, 

Yes = C(I, -®+TK) İT F rss. (8.166) 

Garantir erro nulo em regime permanente implica que yss = rss. Isso ocorre se 
C (L, —®+TK) TF = In. (8.167) 


4 


Desta forma”, a equação do pré-filtro resulta em 


F= (c 1-8+TK) Ur)”. (8.168) 


%0 sistema não pode possuir zero em z = 1. 
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O pré-filtro (ganho) apenas amplifica o sinal de referência e não altera a dinâmica 
do sistema. Se os parâmetros do modelo forem imprecisos, o esquema não vai funcionar 
como esperado. Além disso, ele só é válido para referência constante. Na prática, isso 
não elimina de fato o erro estacionário e, geralmente, não apresenta bons resultados. 

Uma forma equivalente de resolver esse problema é apresentada na Figura 8.14. A 


ideia consiste em rastrear o estado final e a saída em regime estacionário. 


Figura 8.14 — Forma alternativa ao esquema da Figura 8.13. 


Deseja-se que 


Fit = x =X (8.169) 
e que 
Vag = Cx =T, (8.170) 
ou seja, 
CF;r=r> CF, = In. (8.171) 


Em regime estacionário, tem-se ainda que 
Xss = ®x,, + Tuss > (® — Ik) Xss + Tuss = 0. (8.172) 


Como em regime estacionário x, = Xss, O que implica que o erro é zero, tem-se que 
uss; = Far e, portanto, 
(® —1,) Fir+ TFor = 0. (8.173) 


De (8.171) e (8.173), pode-se escrever 


oo A . N - M . (8.174) 


Fi (8-1) T o 0 EN) 
E ; 


Assim, 


C 0 La 
Uma observação é que o sistema da Figura 8.14 pode ser representado como na Figura 
8.15, sendo F = Fy + KF). 


50 sistema não tem solução se a planta possuir zero em z = 1. 
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Figura 8.15 — Diagrama simplificado equivalente ao sistema da Figura 8.14. 


8.12.2 Inserção de integradores 


O problema de rastreamento também pode ser resolvido com a inserção de integra- 


dores na malha. Uma forma de inserir integradores consiste em introduzir um novo vetor 


de estados que integre o erro entre o vetor de saída y[n] e o vetor de comando de entrada 


r[n], ambos com m elementos, como apresentado no diagrama da Figura 8.16. 


y[n] 


Figura 8.16 — Diagrama de blocos de um sistema em malha fechada com insercáo 


de integradores e realimentacáo de estados. 


A equacáo de estados da parcela integral inserida é dada por 
vin + 1] = vin] + r[n] — yin] > v[n + 1] = v[n] + rin] — Cx[n], 
o que, em malha fechada, resulta em 
x[n + 1] = ($ — TK) x[n] + TK;vÍn]. 


Tem-se, portanto, a seguinte equacáo para o sistema aumentado: 


xin+1]| _ [$-—TK a | as A la aii 
vin + 1] —C La v[n] La 
ou seja, 
x[n+ 1] 2 $ Onxm o T [Kk -K,| x[n] a Okxm r| ] 
vin + 1] —C In O k vin] In 


(8.176) 


(8.177) 


(8.178) 


(8.179) 
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Assim, basta determinar o ganho K que aloca os polos para o sistema aumentado da 
Equação (8.179). 

A seguir o lema de Hautus, também conhecido como teste de Popov-Belevitch- 
Hautus, é apresentado e utilizado para mostrar sob quais condições o sistema aumentado 


com integradores é controlável. 


Lema 8.12.1 (Lema de Hautus - Controlabilidade [Sontag 1998]) Seja a matriz de esta- 


dos ® € R*** e a matriz de entrada T € R**", as três afirmações são equivalentes: 
e Opar(B,T) é controlável. 
e Para todo y E C tem-se que rank (ja — 9 r)) =k. 


e Para todo autovalor y € C da matriz de estados tem-se que 
rank (M- ® r]) =k. 


Observe que o rank(yI — ®) = k, exceto para o caso de y ser um autovalor de ®, ou 
seja, a terceira condição do lema, que é mais fácil de testar, garante a controlabilidade, 
se satisfeita. Caso haja um autovalor y € C de ®, tal que [pa — 9 r| tenha posto 
deficiente, então y será um modo não controlável do par (®, T). 


I- 
A versão dual do lema vale para observabilidade e considera a matriz ld a 


yI— 6 


Caso haja um autovalor y € C de ®, tal que | tenha posto deficiente, então y 


será um modo não observável do par ($, C). 
Considere um sistema discreto em que o par (9, T) é controlável, e um sistema 
aumentado ($, I) com a mesma estrutura de (8.179). Pelo Lema de Hautus, para a 


controlabilidade do sistema aumentado, basta verificar o posto da matriz 


Po El 


Como a permutacao de colunas nao altera o posto, pode-se analisar o posto de 


ẹ 0 


8.180 
as (8.180) 


M-® 0 T 
C M-T el 


AlI-@ r 
C 0 


H = 


(\— UI 


E | (8.181) 


para todos os autovalores de ® e para À = 1, devido ao polo do integrador. Considere, 
inicialmente, o teste para os valores de À # 1. Nesse caso, pelo lema de Hautus, as k 
primeiras linhas serão linearmente independentes, pois, pela hipótese de controlabilidade 
do sistema original, a matriz È — 6 r] não possui posto deficiente. Observe também 


que, para À £ 1, as m linhas seguintes são linearmente independentes entre si e das 
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demais. Logo, a controlabilidade do sistema original garante que a matriz H tenha posto 


completo para todo À £ 1. 


1-9 rT 
No entanto, para o autovalor À = 1, é necessário que a matriz não 
tenha posto deficiente. Note que isso equivale analisar se a matriz 
I-® -T 
H' = (8.182) 
C 0 


apresenta posto deficiente. Essa é a condição geral para que o sistema aumentado seja 


controlável. Algumas observações podem ser feitas a partir disso: 
e O sistema original precisa ser controlável. 


e Note que H’ corresponde à matriz de Rosenbrock para z9 = 1. Logo, o sistema 
original não pode ter zeros em zp = 1 pois, caso contrário, H’ terá posto deficiente. 


O zero em zp = 1 cancelaria o polo do integrador. 


e A matriz C precisa ter posto completo de linhas, pois, caso contrário, o posto 
de H’ será deficiente. Isso faz sentido, pois não se deseja rastrear variáveis e 


combinações lineares dessas variáveis ao mesmo tempo. 


8.13 Exemplos de projeto 


Nesta seção são apresentados alguns exemplos de projeto (Exemplos 8.10 a 8.14) 
sobre alocação de polos, observadores de estado e rastreamento de referência. Alguns 
exemplos numéricos e outros mais realistas com os pêndulos descritos no Apêndice C são 


considerados. 


£ Exemplo 8.10: Considere o sistema dado por 


E O ye 
Os) = 7)” +07 


Projete um controlador digital por realimentação de estados de forma que o sistema 
em malha fechada apresente w, = 5,0; ¢ = 0,7. Assuma f, = 20Hz. Considere ainda: 
a) realimentação com todos os estados medidos; b) realimentação com todos os estados 
estimados e observador preditor; c) realimentação de estados com estimador de valor 
atual completo. Considere um pré-filtro (ganho) para corrigir o erro em regime. Lembre- 


se de que isso geralmente não funciona bem na prática! 
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t 


Clock 


To Workspace2 
r 
To Workspacet u 
To Workspace4 
EE ge 
Step ZOH4 > fh » KG >| > 1 o y 
ZOH3 Gain4 Integrator Integratori To Workspace 
MATLAB Function x y 
uncio 
[Po] ZOH2 Ju ZOH1 
To Workspace3 Gain 
E ami 


Figura 8.17 — Diagrama de simulação do Exemplo 8.10 a). 


t 


| x chap 1 ant | x chap 2 ant 
Clock To Workspace2 


Data Store Data Store 
i Memory Memory 
To Workspace 
To Workspaces 
4 x chap_t Integratori | To Workspace 


Ste ZOH1 chap 
E fen | 
2| 


y x chapi 
MATLAB Function 


To Workspaces 


Figura 8.18 — Diagrama de simulação do Exemplo 8.10 b). 


Clock 


To Workspace2 | 


x bar 1 | x bar 2 


To Workspace 1 


Data Store Data Store 
Memory Memory1 


= y 


Integrator Integrator! To Workspace 


Step ZOH1 


MATLAB Function 
To Workspace3 ie t 
ES Re 


Figura 8.19 — Diagrama de simulação do Exemplo 8.10 c). 


Gain 
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Amplitude 


— — — Setpoint 
Saída 


Amplitude 


(a) Saída e Estados 


(b) Sinal de Controle 


Figura 8.20 — Resposta do Exemplo 8.10 a). 
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Amplitude 


— — — Setpoint 
Saída 


Amplitude 


(a) Saída e Estados 


nT; 


(b) Sinal de Controle 


Figura 8.21 — Resposta do Exemplo 8.10 b). 
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Amplitude 


— — — Setpoint 
Saída 


Amplitude 


(a) Saída e Estados 


(b) Sinal de Controle 


Figura 8.22 — Resposta do Exemplo 8.10 c). 
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Figura 8.23 — Diagrama de simulação do Exemplo 8.11. 
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(a) Saida e Estados 


40 


(b) Sinal de Controle 
Figura 8.24 — Resposta do Exemplo 8.11. 
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To Workspace1 


To Workspace3 


Data Store Data Store 
Memory Memory1 Memory2 


Figura 8.25 — Diagrama de simulação do Exemplo 8.12. 
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x (nTy) 


o>] za(nT,) 
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(a) Saída e Estados 


(c) Sinal de Perturbação 


Figura 8.26 — Resposta do Exemplo 8.12. 
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Modelo Pêndulo Roda 
(Vide Apêndice C) 


(a) SIM Ex 08 13a.slx 


ZOH 


Modelo Pêndulo Roda 
(Vide Apêndice C) 


ZOH1 


(b) SIM Ex. 08 13b.slx 


Figura 8.27 — Diagramas de simulação do Exemplo 8.13. 
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T T T 
pred atual 
— ort A 


Figura 8.28 — Resultado do Exemplo 8.13. Foi imposta uma condigao inicial de 
10° em 6,. A ação de controle está em porcentagem de duty-cycle 


do sinal PWM, incluindo o sentido de rotagao. 
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£ Exemplo 8.14: Considere o sistema péndulo invertido rotacional (ou pêndulo de 
Furuta) apresentado no Apêndice C. O vetor de estados é dado por x = [fo 01 do 0)”. 
O modelo já inclui como entrada um sinal normalizado de -1 a 1, representando o ciclo 
ativo (duty-cycle) do PWM e o sentido de rotação do motor DC de 12V que atua no 


braço. O modelo linear é dado por 


0 0 i a 0 
0 0 o 0 

A= , B= ; (8.183) 
0 —24,3054 —0.6725 0 68, 3880 
0 95,3181 1,0087 0 —102, 5819 


Projete a) um controlador por alocação de polos para regular todos os estados; b) 

um controle por alocação de polos com integrador que equilibre o pêndulo e faça o braço 
seguir uma referência dada por uma onda quadrada com amplitude de —7/4 a 7/4 e 
frequência 0,05 Hz. Como especificação, o ângulo do pêndulo (01) deve ter um tempo 
de assentamento menor do que 0,8 s quando sujeito a um desvio de 5° (condição inicial, 
por exemplo) em relação ao ponto de equilíbrio. Valide os controles projetados com o 
modelo não linear do Apêndice C. 
Solução: para o item a), após algumas tentativas, os seguintes polos de malha fechada 
foram escolhidos no plano-s: pei = [-3 —3,5 —11 — 10]. Para o item b), utilizou-se 
também pc; com um polo adicional de malha fechada devido ao integrador em s = —0, 8. 
O restante do exercício está resolvido no MATLAB®. 


clear all; clc; close all; 
fs=100; Ts=1/fs; 
load ('modelo_furuta.mat'); /Carrega modelo em tempo continuo (A, B, C, D) 
[Phi,Gamma] = c2d(A,B,Ts); 
x0 = [0 5*pi/180 O 0]; YCondições iniciais 
item = tals (Escolher Ya! ou tp! 
switch (item) 
la! {Item a 
p cil exp (Is l-3 -325 14 10; 
K = place(Phi, Gamma, p_c1); 
t run = 7; sim('SIM Ex. 08. 14a.slx'); 
figure(1); t d = (0: length(u)-1)*Ts; 
sup pplot (2.10 D5 pilota: 
subplot (2,1,2),stairs(t d, u,'linewidth',1.5); 


otherwise %Item b 


case 


C = [1 0 0 0]; %Nesse caso, a saída é a posição do braço 
Phi. = [Phi zeros(4,1); -C 1]; Gamma_ = [Gamma; 0]; %Sist. 


com Int. 


236 Controle Digital Aplicado 


Controle Digital por Variáveis de Estado 237 


Modelo Furuta 
(Vide Apêndice C) 


(a) SIM Ex 08 14a.slx 


q 


Modelo Furuta 
(Vide Apéndice C) 


(b) SIM_Ex_08_14b.s1x 


Figura 8.29 — Diagramas de simulação do Exemplo 8.14. 
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Estados 
6 [rad], w [rad/s] 


Figura 8.30 — Resultado do Exemplo 8.14 a. Foi imposta uma condigao inicial 
de 5° em 04. A ação de controle representa o duty-cycle do sinal 


PWM, incluindo o sentido de rotação do motor. 
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Referência e Estados 
6 [rad], w [rad/s] 


-0.4 L j 1 L j 1 j 
0 5 10 15 20 25 30 35 40 


ML y, 


Figura 8.31 — Resultado do Exemplo 8.14 b. A ação de controle representa o 


duty-cycle sinal PWM, incluindo o sentido de rotagao. 


Capitulo 9 


Introducao ao Controle Otimo 


Quando nos referimos a controle ótimo, significa que ele maximiza ou minimiza um 
certo funcional (denominada aqui de índice de desempenho) com possíveis restrições. 

Como em sistemas MIMO as matrizes K e L (ganhos de realimentação e observa- 
dor de estados, respectivamente) não são únicas, técnicas de controle ótimo podem ser 
adotadas para utilizar de forma inteligente este “grau de liberdade” de sistemas MIMO 
[Franklin, Powell e Workman 2006]. 

A primeira parte deste capítulo trata de um controle quadrático ótimo variante no 
tempo para o problema de regulação. Em seguida, uma forma estacionária desse controle 
ótimo é obtida, o que resulta no Regulador Linear Quadrático, LQR (do inglês Linear 
Quadratic Regulator). Na sequência, o Filtro de Kalman é introduzido como estimador 
ótimo na presença de ruídos e perturbações com características gaussianas. 

Vale mencionar que, para o projeto do controle quadrático ótimo, o sistema deve 
ser considerado controlável e, para o projeto do filtro de Kalman, o sistema deve ser 


observável. Tais condições serão assumidas ao longo deste capítulo. 


9.1 Controle quadrático ótimo 


O controle quadrático ótimo consiste em encontrar o valor da entrada u[n] tal que 


minimize um índice de desempenho J, descrito como 


E = 


J= ae [N]Sx[N] + 


N— 
Ly” & T [nJQx[n] + ul [nJRu[n}) , (9.1) 
n=0 
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sujeito a 
x[n + 1] = ®x[n] + Tu[n], x[0] = xi, (9.2) 


onde 
e Q matriz (k x k) simétrica definida semipositiva, 
e R matriz (r x r) simétrica definida positiva, 
e S matriz (k x k) simétrica definida semipositiva 


são matrizes de ponderação do índice de desempenho relativas ao estado, ao sinal de con- 
trole e ao estado final, respectivamente. Se o estado final for imposto, tal que x[N] = xy, 
então o primeiro termo à direita de (9.1) é eliminado. Note que o termo 1x! [N]Sx[N], no 
índice de desempenho, implica fazer com que o estado final seja o mais próximo possível 
da origem. 

A minimização do funcional J pode ser feita de algumas formas diferentes, como 
por programação dinâmica [Kirk 2004] ou pelo método de multiplicadores de Lagrange 
[Ogata 1995] [Franklin, Powell e Workman 2006]. Aqui será reproduzida a solução pelo 
método de multiplicadores de Lagrange. 

Deseja-se minimizar o índice de desempenho descrito em (9.1) sujeito às restrições 
impostas em (9.2). Considere um vetor de multiplicadores de Lagrange, A[n + 1], para 


cada instante n. Assim, o seguinte índice de desempenho é definido: 


5 = x TIN]Sx[N] + Y ES fd su” In]Ruln ] 
n=0 
+ XT [n +1] (—x[n + 1] + Bx[n] + Tufn)) ) (9.3) 


Dando sequência ao procedimento de otimização, as seguintes equações são obtidas: 


OL _ th The F 
du) nR +A" [n+1]T =0, (9.4) 
OL 
np a ea t Poo (9.5) 
a =x [nJQ—A'[n] +A" [n+ 1]S =0, (9.6) 
aL 
Ox[N] — x" [N]S — A" [N] = 0. (9.7) 


Note que (9.5) é simplesmente a equacao de estados, ou seja, 


x[n + 1] = $x[n] + Tu[n]. (9.8) 
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O termo A[n] é frequentemente denominado vetor adjunto e, por isso, (9.6) é deno- 


minada equação adjunta, que pode ser escrita como 
Aln] = Qx[n] + &'Ajn+1)], (9.9) 


em que o valor final de A[n] é especificado na Equação (9.7). 
A solução de (9.4) é dada por 


Ruín] = DT Aln + 1] > ujn] = -RTT Afn + 1]. (9.10) 


Sobre as condições de contorno, x[0] = x; deve ser dado. Entretanto, A[0] não é 


usualmente conhecido, sendo A[N] a condição de contorno, dada por (9.7), ou seja, 


AIN] = Sx[N]. (9.11) 


Com isso, o conjunto de equações que descreve a solução do problema de otimização 


está completamente especificada, tal que 


Aín] = $'A[n+1] + Qx[n] 
x[n+1] = Sx[n] + Tu(n] 
ul] = -RT 'An+1] 
x[0) = x; 
A[N] = Sx[N] 


Note que há para x uma condição de contorno inicial e, para A, uma condição de 
contorno final, o que caracteriza um problema de valores de contorno em dois pontos 
(TBVP, Two-point Boundary Value Problem). A solução desse problema não é trivial. 


Um método de solução consiste em assumir [Bryson, Ho e Cantwell 1975] 
A[n] = P[n]x[n], (9.12) 


tal que o problema com valor de contorno em dois pontos em x e A é transformado para 
um problema com condição de contorno em um ponto em P. De (9.12) e (9.10), tem-se 


que 


Ruín] = -T'P[n+1)x[n41] 
= —T'P[n+1](Bx[n] + Tufn)), (9.13) 
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Resolvendo para u[n], obtém-se 
ujn] = — (R+ rTP[ħn +1) TT Pfn +1]8x[n]. (9.14) 
De (9.9) e (9.12), segue que 
P[n]x[n] = Qx[n] + ®' P[n + 1]x[n +1]. (9.15) 
Ao substituir (9.8) em (9.15), tem-se 
Pín]x[n] = 6! P[n + 1] (Bx[n] + Tu[n]) + Qx[n]. (9.16) 
Ainda, substituindo u[n] de (9.14) em (9.16), chega-se em 
Pín]xin] = 8" Pin +1] (exi -P (R +17 Ph + Ir) TTP in + xd) 
+Qx [nl], (9.17) 
que pode ser reescrita como 
(Pin ~S'P[nt¢ +6 Pin +] (R +77 Pfn+ yr)” 


Tr 'Pín+1]8 — a) x(n] = 0. (9.18) 


Como (9.18) deve valer para qualquer x[n], o termo que o multiplica deve ser nulo. 


Assim, 


Pin] = 6" (Pin 41)—P[n+ur (R +77" Pfn+ yr)” Ph + 1) +Q, 


(9.19) 
que é frequentemente escrita como 
P[n] = #'M|n +1] +Q, (9.20) 
em que 
Mjn +1] = Pin + 1] — Pin + JP (R +rTPħn +1) "TT Pn+1). (9.21) 


A Equação (9.19) é denominada equação de Riccati. De (9.11) e (9.12) pode-se 
verificar que 
P[N] =S, (9.22) 
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e, portanto, a solução é descrita pelas equações recursivas (9.20) e (9.21), com a condição 
de contorno dada por (9.22). A recursão deve ser resolvida de trás para frente, pois a 


condição de contorno é um ponto final. A ação ótima de controle é dada por 
u[n] = —K[n]x[n], (9.23) 
em que, de (9.14), 
K[n] = (R+T"Pín+ 11) TP Pint 1s. (9.24) 


Os calculos sao resumidos no seguinte procedimento: 


Faça P[N] = S e K[N] =0. 

Faça n = Ne 

Calcule Min] = P[n] — P[nJP (R+T"P(n]T) *T7P(n]. 
Calcule K[n — 1] = (R+ Tr Pin]r) T'P[n]®. 
Armazene K[n — 1]. 

Calcule P[n — 1] = $'Min]9 + Q. 


Fagan =n-1. 


PA Sor Sey > 


Volte para o passo 3. 


Portanto, uma vez conhecido o modelo do sistema e as matrizes de peso S, Qe R, 
e a duração do problema N, os valores de K[n] devem ser previamente calculados de 
n = N até n = 0 (de trás para frente) e armazenados. 

Dada a condição inicial x[0] = x;, os valores de K[n] armazenados são utilizados para 
o cálculo do sinal de controle conforme a lei u[n] = —K[n] x[n], em que x[n] evolui de 


acordo com a Equação (9.8). Pode-se verificar que o custo ótimo é dado por 
Jmin = x" [0]P[0]x[0]. (9.25) 


O Exemplo 9.1 mostra o processo interativo para calcular o ganho de realimentação 


de estados para cada instante e, consequentemente, o esforço de controle. 


£ Exemplo 9.1: Considere um sistema descrito por 


x[n + 1] = x[n] + Tulnl, 


Ego 


onde 
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9.2 Controle LQR 


Como visto na seção anterior, o controle ótimo quadrático é dado por um ganho 
variante no tempo, K[n]. Se for considerada a condição em regime, ter-se-á um ganho 
constante Kss, que é muito mais fácil de se obter do que o ganho variante no tempo. De 
fato, para um problema de tempo infinito, denominado regulador, a solução com ganho 
constante é ótima. Assim, tal solução é denominada regulador linear quadrático (LQR, 


Linear Quadratic Regulator). 
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Tabela 9.1 — Cálculo de K[n] do Exemplo 9.1. 


ny 


Pin] 


8 


“I 


[Sp] 


a 


1 
0 


: 


10,0667 
4, 4444 
10, 0897 
4, 4418 


4, 4404 
10, 1028 
4, 4397 
10,1036 


y b 


i 


9 4 
[2,0 
À le 
4,4 
[2,2 
5,6 
4,4444 
[2, 2222 
os 
4, 4418 
[2,2209 
E 
4, 4404 
[2,2202 
oa 
4, 4397 
[2,2198 
5, 6397 
4, 4395 
[2,2197 
5,6397 


e 
h 
já 1009 
A 
A 


4, 4395 


1,8148 


1,8193 


1,8198 


1,3189 


| 
| 
1,8197| 
| 
| 
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Tabela 9.2 — Cálculo de u[n] do Exemplo 9.1. 


nt x(a ul 

0 [1,0 o] 2,2197 
1 [-oj2197 1,0] -1,3321 
2 (0,2285 —0,2197| 0,1074 
3 |—0, 0899 0,2285 | —0, 2159 
4 (0,0612 —0,0899| 0,0273 
5 [-0,0302 0,0612] 0,0435 
6 [0,0183 —0, 0302] 0,0118 
7 [-0,0121 0,0183| —0,0062 


8 0,0062 —0,0121 0,0 


Para N > oo, o índice de desempenho poder ser modificado para 


J= 


LSS (nln + ula). (9.26) 
n=0 


O termo ix! (N)Sx[N] não aparece nesta representação pois, ao assumir estabilidade 


no regulador ótimo, xss converge para zero. 

Uma forma de se obter K,, consiste em calcular P[n] até que ela se encontre na 
condição de regime, ou seja, Pss, e assim utilizar esse valor em (9.23) para obter Kss. A 
desvantagem desse método é o elevado esforço computacional. 

Outra forma consiste em utilizar na equação de Riccati na forma estacionária, deno- 


minada equação algébrica de Riccati. Em regime estacionário, tem-se 
P, = 8" (Pos —PoP(R+I'Por) TP) B+Q. (9.27) 


Devido ao fato de a equação ser quadrática em P,,, há mais de uma solução. A 
solução escolhida deve ser definida positiva. Em muitos casos não é possível obter uma 
solução analítica de (9.27), o que exige algum método numérico para sua solução. 

No MATLAB® há o comando dlgr, que, de acordo com a notação utilizada aqui, 
possui a seguinte sintaxe: [K,P,E] = dlqr(Phi,Gamma,Q,R,N). Tal comando calcula a 


matriz de realimentação de estados K, de forma que u[n] = —Kx[n] minimize o seguinte 
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índice de desempenho: 
1 co 
=5 2 [n]Qx[n] + u! [n]Ru[n] + 2x" [nJNu[n]) , 


para o sistema descrito por 
x[n + 1] = ®x[n] + Pu[n]. 


Por padrão, N=0, valor este assumido quando o parâmetro é omitido. Adicionalmente, 
o comando retorna solução da equação algébrica de Riccati, P, e os autovalores de malha 
fechada do sistema, E. 

Se a equação de saída do sistema é dada por y[n] = Cx[n], e Q = C'C, então a 


função custo do LQR pode ser escrita como 


[n]C* Cxín] + u’ [nJRu[n]) 


A 


¿ES 


E 
2,0 “{nly[n] + u' [n]Ruln)) . (9.28) 


Quando a matriz R é da forma R = pI, e p > 0? o problema é denominado LQR 


cheap control. 


9.2.1 Escolha de Q e R 


Em relação ao projeto do controlador LQR, a escolha das matrizes Q e R requer uma 
certa quantidade de ajustes até que se tenha uma resposta satisfatória. Um aumento em 
Q aumenta a velocidade de convergência da solução ao ponto de equilíbrio. Um aumento 
em R reduz o esforço de controle considerado. 

Há algumas diretrizes que podem conduzir a uma boa escolha, ou pelo menos res- 
tringir a busca, de forma a torná-la menos exaustiva. A regra de Bryson, mencionada 
em [Franklin, Powell e Emami-Naeini 2002], sugere escolher Q e R diagonais, tais que 


1 
Máximo valor aceitável para x?’ 


Qui = = 1,2) 2a; ls (9.29) 


1 
Rii = y DE Liss: 9.30 
“Máximo valor aceitável para us j ( ) 
Tal regra é frequentemente utilizada como um ponto de partida para um método 
interativo de tentativa e erro, a fim de se obter um sistema em malha fechada com 


propriedades desejadas. 
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As matrizes Q e R não estão diretamente relacionadas com as especificações de 
desempenho, ou seja, com a posição exata dos polos de malha fechada. Devido a isso, 
a seguir é descrito um método para modificar tais matrizes de forma a garantir que os 
polos de malha fechada fiquem no interior do círculo de raio 1/a, com a > 1. Com isso, 
a resposta transitória decairá com taxa pelo menos igual a 1/a”. Considere a seguinte 
relação: 

z[n] = 0"x[n], a > 1. (9.31) 


Pode-se definir o tempo de assentamento tss do estado x; como sendo o tempo que 
o estado decai a 1% do seu valor inicial, assumindo que os demais estados sejam nulos 
em n = 0. Por exemplo, se x;[0] = 1,0, tss é o tempo necessário para que x; tenha valor 


igual a 0,01, i.e., se tss = Nss Ts, tem-se que 
am Ts) <0, 0lm(0). (9.32) 


Ao considerar a seguinte aproximacáo: 


tj (NssTs) = 25(0)(1/0)"", (9.33) 
verifica-se que 
a > 1000/79), (9.34) 
De (9.31) note que 
zin+1] = a®*'x{[n+ 1] = a[a"(®x{n] + Tu[n]) 


a [($2[n] + Pv[n])) 
= aezin| + aTvín], (9.35) 


em que v[n] = a”u[n]. Assim, projeta-se o controle ótimo para z[n], ou seja, considerando 
as matrizes aB e aI’, o que garante z[n] estável. Consequente, x[n] será estável e terá 
taxa de decaimento pelo menos igual a 1/a”. 

O Exemplo 9.2 apresenta um projeto de controle LQR aplicado em um sistema de 


tanque quádruplo. 


£ Exemplo 9.2: Considere o sistema de tanques quádruplos representado na Figura 
9.1 [Neves et al. 2016]. Trata-se de um sistema com duas entradas (as duas tensões 
nas bombas) e duas saídas (os níveis dos tanques 1 e 2), ou seja, um sistema TITO 


(Two-input-Two-output). O modelo fenomenológico, já linearizado em torno do ponto 
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Q = diag([5 5 1e-3 1e-3 1e-1 1e-1]); R = 10*eye(2); 
K = dlqr(Phi_,Gamma_ ,Q,R); 
Sam OuSTM IEX 109102; 


Código de geração de gráficos foi omitido 


/Projeto do Controlador 


O código do Bloco Matlab Function é apresentado a seguir: 


function Fu ls ue?) = feat 1, so. xa, E) 


AA KOA e L E KO O) ex DS) Ex 3 y, 
MATO AC KO DE ARANA E KRTINA S D 


2 


O diagrama de simulação SIM Ex 09 02.slx é 


sultados são apresentados na Figura 9.3. Como o desempenho foi 


necessidade de reajustes em Q e R. 


i 
IO DT 


EEE vatório 


i. 


Bomba 1 


y Bomba 2 


(a) 


mostrado na Figura 9.2. Os re- 


satisfatório, náo há 


(b) 


Figura 9.1 — Sistema tanque quádruplo do Exemplo 9.2. (a) diagrama esquemá- 


tico; (b) planta física. 
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E) +2 


Figura 9.2 — Diagrama de simulação do Exemplo 9.2. 
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Figura 9.3 — Resposta do Exemplo 9.2. Observe que os resultados estão de acordo 


com a especificação. 
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9.3 Filtro de Kalman 


O filtro de Kalman consiste em um conjunto de equações recursivas para estimar os 


estados do sistema descrito pelas seguintes equações de diferenças: 


x[n + 1] = x[n] + Pu[n] + Vw(n], (9.39) 


y[n] = Cx[n] + vin], (9.40) 


onde w[n] e v[n] representam, respectivamente, o ruído de processo e o ruído de medição, 


ambos caracterizados como ruído branco, tais que 


E (viklw" [j]} =0, (9.41) 
E [v[k]v" [j]} = Es e (9.42) 
E (w[x]w' [5]) “| by Pd (9.43) 


em que Rw e Ry, representam as matrizes de covariáncia do ruído de processo e de 
medição, respectivamente. 

Como observador de estados, o filtro de Kalman é ótimo para sistemas lineares su- 
jeitos a ruído branco. A partir de Ry e Rw e do modelo linear do sistema, o ganho do 
observador é determinado, de forma recursiva, como resultado de um processo de oti- 
mização. O trabalho original de Kalman foi publicado em 1960 [Kalman 1960]. Desde 
então, tal algoritmo vem sendo utilizado em uma enorme quantidade de aplicações. 

Considere um estimador com a mesma estrutura do observador de valor atual, tal 
que 

Zin] = X[n] + Lefn)(y[n] — C[n)), (9.44) 


x[n] = Px|n — 1] + Puln — 1), (9.45) 


onde (9.45) é denominada atualização temporal e (9.44) atualização de medida. Definem- 
se 
X[n] = X[n] — x[n], (9.46) 


X[n] = x[n] — x[n], (9.47) 
como os erros de estimação a posteriori e a priori, respectivamente. Pode-se verificar que 


žin] = (1— L.[n]C) X + L.[n]v[n], (9.48) 
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X[n] = BX[n — 1] — Pw[n — 1]. (9.49) 
As matrizes de covariâncias (medidas das magnitudes dos ruídos) dos erros de esti- 
mação a posteriori e a priori são, respectivamente, dadas por 
Pin] = E{X{n]&™n]} 
= E{(-Le[nJC) Xn] $" [n] I-16)" } + 
E (Leln)vin) v" [nJLZ (nl) 


= (I-L.(n]C) M[n](1 — L.[(n]C)' + Leln] Ry L [n], (9.50) 
M[n] = E { in] x! In] 
= E ((exin — 1] — Ww[n — 1]) (Sn — 1] — Vwín — 1) 
= SP[in—-1]6' + WR, v'. (9.51) 


O ganho L.[n] é obtido ao minimizar o índice de desempenho 
E ='TE(Plal). (9.52) 


Antes de prosseguir, considere as seguintes propriedades: sejam G, A, X, Be W 


matrizes de dimensões compatíveis, então 


mem ke + AXB) W(G + AXB)'| =2A'T(AXB+G) WB’, 


E (XAX')=X(A+A‘). 


Ox 
Com isso, verifica-se que 
AH Tr [a —L,[n]C) M[n](1 — Le{nJC) "| =-2(I-L,[n]C)M[n]C™, (9.53) 
i o 
OL. Tr (L.(n] Ry Lo [n]) = L.[n] (Ry + R$) = 2L,[n]Ry. (9.54) 
Logo, 
Tan = -2(1 — L¿[n]C) Min] C" + 2L-[n]Rv. (9.55) 


Ao igualar (9.55) a zero, encontra-se L.[n], tal que 


Lefn] = M[n]CT (C Min] CT + Ry). (9.56) 
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Considere novamente a Equação (9.50). Ao expandir os termos, chega-se em 
P[n] = Min] — Le[n]JCM[n] + Lefn] (CM[n]C* + Ry) L? [n] - MnJC' L] [n]. 
Substituindo (9.56) no terceiro termo do lado direito de (9.57), obtém-se 


P[n] = (1 L.(n]C) Min]. 


(9.57) 


(9.58) 


Neste ponto já se tem uma versáo do filtro de Kalman como estimador de estados, 


baseado no estimador pelo valor atual: 


1. Defina Ry, Rw, X[—1] e P[-1]. 

2. Facan=0. 

3. x[n] = ®x[n — 1] + Tu[n — 1] De 

4. Min = @P[n—1]@" + VR, wT =e 
5. Leln] = M[nJCTRZ! (C Min] CTR; +1) 

6. fin] = X[n] + L.[n](y[n] — Cx[n]) correção 
7. Pln]= (I- L¿[n]C) Min] 

8. Façan=n+1. 

9. 


Volte para o passo 3. 


Neste esquema, a predição é atualizada antes da correção. Em seguida, as equações 


serão manipuladas para se chegar em novas representações. 


A Equação (9.56) pode ser rearranjada como 


Len] = Min][CTR¡'R, (CMħn] CT +R)” 
= Min]¡C"R;! (C Min] CTR; +~. 
Com isso, 
L.[(n](CMin]C"R¡*+1) = Min]C"Ry?, 
ou seja, 


L.[n] = Min]C'R;* — L.[n]C Min] C'R;* = (1 — L.[n]C) Min] C'R¿!. 
Portanto, de (9.58) e (9.61), chega-se em 


L.[n] = P[nJC'R,?. 


(9.59) 


(9.60) 


(9.61) 


(9.62) 
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De (9.58), verifica-se que 
P[n]M~*[n] = (I— L.[n]C). (9.63) 
Ao substituir (9.62) em 
1 


P[n] = (M”*[n] +C'R¿*C) . (9.64) 


Com isso, chega-se a outra forma do filtro de Kalman: 


Defina Ry, Rw, x[0] e M[0]. 

Faça n = 0. 

Calcule P[n] = (M”*[n] + C'R ON. 

Calcule L,[n] = P[n]CT R7. correção 


Calcule X[n] = x[n] + Lefn] (y[n] — Cx[n]). 
Atualize X[n + 1] = ®X[n] + Tu[n]. 
Atualize Mín + 1] = ®P[n] ®' + VRyV'. 
Faça n=n+1. 


| predição 


SPA SCF re 2 e 


Volte para o passo 3. 


Observe que essa nova representação faz a predição de Min + 1] e X[n +1] após a 
correção. 
Além disso, uma forma numericamente mais eficiente de se escrever (9.64) pode ser 


obtida utilizando-se o seguinte lema: 


Lema 9.3.1 (Lema da inversão de matrizes) Considere matrizes R, S, T eU de dimen- 
sões compatíveis e assuma que não haja problemas de singularidade com as matrizes a 


serem invertidas. Então, a seguinte relação é válida: 


(RESTO)? = R! - R!S[T-! + URIS] PUR. 


Pelo Lema 9.3.1, (9.64) pode ser reescrita como 
P[n] = Min] — M[n]CT (CM[n]CT + Ry) * CMfn]. (9.65) 


Note que em (9.62) o ganho L,[n] depende de P[n] dada em (9.65), que, por sua vez, 
depende de Mjn]. Assim, tem-se uma terceira forma do filtro de Kalman como observa- 


dor de estados: 
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1. Defina Ry, Rw, X[0] e M[0]. 

2. Facan=0. 

3. Calcule P[n] = M[n]— 

M[n|CT (CM[n]CT + Ry)" CM[r]. 
Calcule L.[n] = P[n] CTR}. 

Calcule X[n] = X[n] + L.[n](y[n] — Cx[n]). 
Atualize x[n + 1] = ®X[n] + Tu[n]. 
Atualize Mjn + 1] = ®P[n] ®'+ VR, Ww". 
Faca n=n+1. 


correção 


predição 


o PASAS 


Volte para o passo 3. 


As equações recursivas para determinar M e P no filtro de Kalman são repetidas 
aqui: 
P[n] = Min] - M[nJC™ (CM[n]CT + Ry) CMin), 


M[n + 1] = ®P[n] PT + WR, v'. 
Já para o controle ótimo, obteve-se 
Min] =P(n] -PínT (R+T"Pín]T) "TT Pp, 


Pín — 1] = 9'M[n]9 + Q. 


Note que as duas formas sáo semelhantes, exceto pelo sentido da evolucáo tempo- 
ral. Pode-se considerar aqui também a versáo em regime estacionário para o estimador, 


resultando em um ganho constante L,,. Por analogia ao controle ótimo, tem-se 


Les = Ms CCM O ERJ >, (9.66) 
onde 
Mss = ®P,, ®' + WR, V', (9.67) 
e 
Pss = Mss — MssC7 (Ry + CMC”) CM. (9.68) 


De (9.67) e (9.68), obtém-se 
Mss = & (Mss — M,sCT (Ry + CM,5CT) 'CM,,) 97 + URwH™. (9.69) 


No MATLAB® há o comando dlge, que, de acordo com a notação utilizada aqui, 
possui a seguinte sintaxe: [L,M,P,E]=dlqe(Phi,Psi,C,Rw,Rv), sendo E os polos resul- 


tantes do observador. 
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Tabela 9.3 — Parâmetros duais do LQR e do FK em regime estacionário. 


LQR FK 
$ pT 
T pr 
Q URW 
R Ry 


O LQR e o FK estacionários são duais, ou seja, relações análogas sao obtidas nos 
dois casos, simplesmente fazendo as correspondências apontadas na Tabela 9.3. 

O Exemplo 9.3 mostra um projeto de um observador usando o filtro de Kalman na 
sua forma que considera a predição sendo feita após a atualização e na versão em regime 


estacionário. 
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Ca | 


Data Store To Workspace4 
Memory 
Step1 mn 
DIR 
Addi Zero-Orde 
Nem x_chap_out 

> ie ak ies To Workspace3 

y= Cx+Du E b E. 

EM eiii Add2 Zero-Order 
Hold 
w 


MATLAB Function 


[EN 


v 


y_noisy 


To Workspace2 
x'= Ax+Bu A 
y=Cx+Du x oui 
State-Space2 To Workspace 1 


Figura 9.4 — Diagrama de blocos da simulação o Exemplo 9.3 a) e c). 


= E el] 


Data Store Data Store tom To Workspace4 
Memory1 Memory 
eJ 
Step1 + 
= T > Ta 
Add1 
x_chap_out 
Step2 + To Workspace3 
+ Ja 
State-Space1 Add2 Zero-Order 
Hold 


MATLAB Function 


v 


x'= Ax+Bu 
y= Cx+Du 


State -Space2 


y_noisy 


To Workspace2 


x_out 


To Workspace 1 


Figura 9.5 — Diagrama de blocos da simulação do Exemplo 9.3 b). 
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Figura 9.6 — Resposta do Exemplo 9.3 a). 
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Figura 9.7 — Resposta do Exemplo 9.3 b). 
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Figura 9.8 — Resposta do Exemplo 9.3 c). 


Capitulo 10 


Aspectos Praticos 


Este capítulo apresenta formas de representação de sistemas discretos e aborda alguns 
problemas encontrados na aplicação de controladores digitais em relação a ruídos de 
quantização e arredondamento numérico. Por fim, um pseudocódigo de implementação 


de um controlador digital é apresentado. 


10.1 Estruturas de representação de sistemas dis- 
cretos 


Equações de diferenças lineares podem ser representadas por um diagrama de blocos 
com símbolos para soma entre duas sequências, multiplicação de uma sequência por uma 


constante e atraso unitário. Considere, por exemplo, a seguinte equação de diferenças: 
u[n] = e[n] + be[n — 1] + aufn — 1]. (10.1) 


Graficamente, pode-se ter uma representação como a da Figura 10.1. 


e[n] uni 


eln — 1] un — 1] 


Figura 10.1 — Representação gráfica da equação de diferenças em (10.1). 
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Considere como exemplo um sistema em tempo discreto de terceira ordem com a 


seguinte função de transferência: 


bg +1271 +bzz? +3277  B(z) (10.2) 
~~ L+ay2-1 + agz-2 +a32z-3 A(z) ` 


C(z) 


Há várias formas de representação em diagrama de blocos para este sistema. Algu- 


mas delas serao vistas a seguir. 


Forma direta I 


Note que C(z) pode ser escrita como C1(2)C2(2), com 


W 
Ci(z) EO) B(z) bo + biz 1 + bəz E + b3z o (10.3) 
j ma a 1 
z 
C a 10.4 
2(2) W(z) A(z)  1+a121+a922?2+a32 8 di 
Tem-se, portanto, a representacáo da Figura 10.2. A equacáo de diferencas é dada 
por 
un] = —aju[n— 1] — azu[n — 2] — azu[n — 3] + 
boe[n] + bie[n — 1] + bae[n — 2] + bze[n — 3]. (10.5) 


Figura 10.2 — Forma direta I de representacáo do sistema da Equacáo (10.2). 
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Forma direta II 


O Exemplo 10.1 será utilizado para derivar a forma direta II. 


Figura 10.3 — Sistemas referentes ao Exemplo 10.1. 


Generalizando o resultado obtido no Exemplo 10.1, o sistema da Equação (10.2) pode 
ser representado conforme ilustrado na Figura 10.4. Essa é a forma direta II. Tal forma 
é canônica, ou seja, o número de atrasos na representação é igual à ordem do sistema. A 


equação de diferenças é dada por 
vin] = e[n] — ayv[n — 1] — azu[n — 2] — agv[n — 3), 


bovin] + byv[n — 1] + bov[n — 2] + b3u[n — 3]. 


uln] 


(10.6) 
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Figura 10.4 — Forma direta II de representação do sistema da Equação 10.2. 


A forma direta II, por utilizar um mínimo número de atrasos, economiza memória. 
Para sistemas de ordens elevadas, algumas formas alternativas podem ser utilizadas 
para reduzir a sensibilidade a erros de quantização dos coeficientes do filtro, tais como a 


forma cascata e a forma paralela. 


Forma cascata 
Os polinômios do numerador e do denominador de uma função de transferência po- 

dem ser escritos como o produto de polinômios de menor ordem, ou seja, 

B(z) _ By (z) Bo(z)B3(z) 

A(z)  Ar(2)A2(2)A3(2)' 


Usualmente, os polinómios sao fatorados em termos de primeira ordem e termos de 


C(z) = (10.7) 


segunda ordem, i.e., 


I] (= O12) JI G- b2,mz 5a =0 ut) 
C(z) = E e (10.8) 
Ha GZ SH (1 — da.n27!)(1 — až 271) 


onde K é uma constante, M = Mı + 2M» é o grau do numerador e N = Ni + 2N2 é o 
grau do numerador. Note que, fatorados desta forma, os polinômios representam a confi- 
guração mais geral de polos e zeros. As Equações (10.7) e (10.8) sugerem representações 
em cascata para uma função de transferência. Há uma certa liberdade na escolha da 
composição dos subsistemas a serem cascateados. O Exemplo 10.2 é sobre a realização 


em cascata. 
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Forma paralela 


A estrutura de representação paralela é obtida efetuando-se a expansão em frações 


parciais de funções de transferência. O Exemplo 10.3 apresenta este procedimento. 
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(b) 


Figura 10.5 — Formas diretas I (a) e II (b) de representação em cascata do sistema 
do Exemplo 10.2. 
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Figura 10.6 — Realização em paralelo do Exemplo 10.3. 


No livro [Ingle e Proakis 2012] algumas funções foram desenvolvidas em MATLAB® 
para converter de uma forma de implementação em outra. Os códigos dessa referência 


estão disponíveis em [Proakis 2021]. 
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10.2 Erros numéricos de precisão 


Nesta seção serão analisadas duas fontes de erros comuns na implementação de com- 
pensadores digitais: erros de quantização na conversão A/D e erros devido ao arredon- 


damento dos coeficientes do compensador. 


10.2.1 Erros de quantização na conversão A/D 


Suponha um conversor A/D de N bits e resolução (nível de quantização) igual a Q. 
O erro de quantização pode ser modelado como uma variável aleatória uniformemente 


distribuída entre —Q/2 a +Q/2, conforme apresentado na Figura 10.7. 


à ple) 
Q 


-Q /2 Q/2 et) 
Figura 10.7 — Função densidade de probabilidade do ruído de quantização. 


A variância do ruído e(t) é dada por 


à Q/2 Q? 
o = g / [e(t) — e(t)]? dt = TE» (10.9) 
-Q/2 


em que E(t) representa o valor médio de e(t), que nesse caso é nulo. Portanto a variância 
do ruído associado ao erro de quantização é um doze avos do quadrado do nível de quanti- 
zação, o que é um valor extremamente pequeno quando se tem um conversor A/D de alta 
resolução. Para ter uma ideia mais clara sobre o efeito do erro de quantização em um sis- 
tema digital em malha fechada, considere, como apresentado em [Fadali e Visioli 2013], 
um sistema de primeira ordem do tipo 

G(s) = == (10.10) 


cujo equivalente discreto, considerando ZOH e amostragem com período Ts, é dado por 


Y(2) KzU(1-e 7/7) 


SU 1 meant 


Ao aplicar a transformada-z inversa, chega-se à seguinte equação de diferenças 


yin] = e`Ts/Tyjn -1]4+ K(1- eTs/7)u[n — 1]. (10.12) 
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Considere uma lei de controle proporcional do tipo u[n] = —K.y[n]. No entanto, se o 
erro de quantização for considerado ao se digitalizar y[n], tem-se que u[n] = —K.(y[n] — 


e[n]). Portanto, em malha fechada, tem-se 
y[n] = [e 7” — K.K(1 — e77/")]y[n — 1] + K-K(1 — e77#/7)e[n — 1]. (10.13) 


que é da forma 
yin] = ay[n — 1] + be[n — 1]. (10.14) 


Ao assumir condições iniciais nulas, tem-se a solução do tipo 


n—1 
yin] = 5 a”—*~! befi]. (10.15) 
i=0 
Assim, 
n—1 
yin] =D fe! — K¿K(1 e Tp KK( — e Te”) efi]. (10.16) 
i=0 


O valor esperado da saida é dado por 


n—1 
E{y[n]} = Y [e 7/7-KK( -e Tp KK(1— e 7/7) Efe[i]) =0. (10.17) 
Por definição, a variância de y é dada por: oł = Efy”[n]) — E?{y[n]}. Como 
E{y[n]} = 0, tem se que o, = E{y?[n]}. Voltando à forma (10.14), tem-se 


y? [n] = a?y?[n — 1] + 2aby[n — 1]e[n — 1] + b?e?[n — 1]. (10.18) 


Com a hipótese de que e[n] é ruído branco, verifica-se que E{y|[n — 1]e[n — 1]} = 0. 
Adicionalmente, se o sistema for estável, a série temporal será estacionária e, portanto, 
02 = E{y?(n]} = E{y?[n — ml). Logo, 


b2 
o? = a0? + b0? > o? = a ae, (10.19) 
Ao substituir os valores de a e b e considerar a Equacáo (10.9), chega-se em 
KK(1 — —Ts/T]2 2 
o = ali = El. (10.20) 
1 — [e-Ts5/7 — K¿K(1—e-T5/7)]2 \ 12 


Se (Ts/7) < 1, pode-se considerar que e~7:/7 ~ (1 —T,/7). Ainda, de forma 
aproximada, será considerado que 27 > T,(1 + KKc). Com isso, pode-se verificar que 


2, ERT (Q 
“Y (KK +1D(r) ( 5) ão 
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Note que, para o caso particular considerado, 0; é aproximadamente linear em relação 
ao período de amostragem. A Figura 10.8 apresenta os gráficos normalizados das relações 
(10.20) e (10.21). 


0.01 
Sem approx. 
eager? Com approx. 
0.006 
No 
6 
== 
AN > 
b 
0.004 
0.002 + 
0 ; 0 3 0 ; 
0 0.05 0.1 0 0.05 0.1 0 0.05 0.1 
T/r Toft Tar 


Figura 10.8 — Gráficos normalizados das relações (10.20) e (10.21) em função de 
(Ts/7). 


Uma forma de minimizar o efeito da variáncia do erro de quantizagao na saída consiste 
em diminuir 7. No entanto, frequências de amostragens elevadas exigem hardwares 
mais eficientes e podem agravar problemas de quantização dos coeficientes da equação 


de diferenças do controlador digital. 


10.2.2 Erros devido ao arredondamento de coeficientes 


Considere, por exemplo, a versão em tempo discreto da função de transferência de 


um compensador digital, tal que 
k =, 
O O 
C(z) = Liza i (10.22) 


que pode ser reescrito como 


10.23 
li (1 — pjz7") ' } 


em que os termos z; e pj representam os zeros e os polos de C(z), e K é o ganho do 


compensador. Para a análise seguinte apenas os polos serão considerados. 
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A ideia é verificar a sensibilidade do m-ésimo polo (pm) em termos da variação 


do ¢-ésimo coeficiente do polinômio do denominador de (10.22) (ag), devido a erros de 


arredondamento numérico, ou seja, (0pm/dar)|-=p,.- Para tanto, define-se A(z) = 1 — 


Es Ge = Ho (1—pj2"*). Assume-se também, de forma simplificada, que A(z) 


possui apenas polos simples. Assim, 


Note que 


e que 


Portanto, 


OA(z) _ OA(z) OPm 


dar OPm dar. 
3A) e 
ae ? 
dA(z) $ 
=g 1 Il (1 — pjz7"). 
Spm j=0;jżm 
OPm e OA(z) OA(z) 
das loop, = das OPm )l¿=p,, 
= 1-0 
z k 
Mo G-p) 
j=0;jZm 2=Pm 
_pi—t 
= k p F 
JI (1—pjpm) 
j=0;j&m 


(10.24) 


(10.25) 


(10.26) 


(10.27) 


Caso os polos estejam agrupados e muito próximos um dos outros, o denominador 


em (10.27) torna-se pequeno, o que causa uma sensibilidade elevada. Tal efeito torna- 


se maior conforme a ordem do sistema aumenta. Essa é uma enorme desvantagem das 


formas de implementação diretas I e II. Pequenos erros nos coeficientes podem causar 


erros consideráveis nas posições dos polos e zeros. Tal problema é ainda agravado para 


elevadas taxas de amostragem. 


Uma forma de minimizar o efeito do erro de quantização de coeficientes consiste em 


utilizar as formas cascata ou, preferencialmente, a paralela. O Exemplo 10.4 elucida essa 


ideia. 
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Forma direta 1 - coefs sem truncamento 

b. = Cd.num{:}; bd O = b (1); b = b (2:end);ALb O, bl: coefs do numerador 

a. = Cd.den{:}; a = a (2:end); %[1, a]: coefs do denominador 

/ Forma direta 1 - coefs com truncamento 

b_T_ = round(b *1e4)/1e4; 

DOT = DDT (D; bat = pI @ end); Ab 0 T, bell: coefs do numerador 

a T = round(a_ *ie4)/1e4; a T= a_T_(2:end);%[1, a Ti: coefs do 
denominador 

hForma Paralela - coefs com truncamento 


hdir2par converte da forma direta para a paralela. 

hFonte: John Proakis (2021). Digital Signal Processing Using MATLAB 
“(https ://www.mathworks.com/matlabcentral/fileexchange/ 
12189-digital-signal-processing-using-matlab), 

“MATLAB Central File Exchange. Retrieved August 10, 2021. 

[C,B,A] = dir2par(b_,a_); 

c_TP = round(C#1e4)/1e4;%C_1(z) = c_TP 


B_ = round(B+1e4)/1e4; A = round(B*1e4)/1e4; 

A = B QL) bI OLIP = a a (1); b1 -TP = bist. DIES e DS 
D2 EP = Ba) b2 0 TP = D2 TP G); b2 TP = b2 TP 2: end); 
ai TP. = A SS aT TP = ai TP. (2:6nd): 

a2 TP. = A(2,:); a2 TP = a2 TP (2ciend))); 


AEDI O TP, bi. TP]: coefs do numerador de C2(s); 

4[b2.0. TP, b2 TP]: coefs do numerador de C3(s); 

%[1, al TP]: coefs do denominador de C2(s); 

%[1, a2 TP]: coefs do denominador de C3(s); 

t run = 253 

Sim CUSTE TO 0A veloc) es 

t_d = (0: length(u)-1)*Ts; 

subplot 21) pier prob (tiem, ro KSDS set (piero LineWidth 2); hold on; 
pi = prot t sim y Den tsi Myer nae Ges ami yD emus). 
axis([0 25 -2 2]); 

subpilliotiGl22) 5) p = stairs Ct dru bi) >) hold on; 

p3 = stairs (t a u Re o-n pa S stairs (t dru TELGE: 
axis([0 25 -5 3010; 


function u = fen(e, a, b, b 0) 

global u_anti u_ant2 u_ant3 u_ant4; 

global e_anti e_ant2 e_ant3 e_ant4; 

u= - a(i)*u_anti = a(2)*u_ant2 - a(3)*u_ant3 - a(4)*u_ant4 + 
b_O*e + b(1)*e_anti + b(2)*e_ant2 + b(3)*e_ant3 + b(4)*e_ant4; 


u_ant4 = u_ant3; u_ant3 = u_ant2; u_ant2 = u anti; u_anti = u; 


e_ant4 = e_ant3; e_ant3 = e_ant2; e_ant2 e anti; e anti = e; 


function ul = fen(leT, aT, b_T, b.O.T) 


280 Controle Digital Aplicado 


| ae | 
| ae | 


Figura 10.9 — Diagrama de simulação do Exemplo 10.4. 
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Ação de Controle 


Resposta ao Degrau Unitário 


E 
E 
3 
-0.5 f + 
Referéncia 
ai Forma Direta I s/ truncamento 
seeeeees Forma Direta I c/ truncamento 
Ag le=== Forma Paralela c/ truncamento 
2 B E g To iu s £ 2 ai sı i mo u z 
0 5 10 15 20 25 0 5 10 15 20 25 


Figura 10.10 — Resultados de simulação do Exemplo 10.4. 


10.3 Exemplo de pseudocódigo 


A seguir é apresentado um simples pseudocódigo (Exemplo 10.5) para uma equação 


de diferenças em um hardware digital. Alguns aspectos devem ser antes mencionados. 


e No exemplo a seguir, assume-se que a taxa do A/D é bem elevada (ex. 20 kHz), 
mas deseja-se um período de amostragem para o sistema menor do que isso (ex. 


50 Hz). 


e Se a frequência de amostragem desejada é bem próxima da máxima taxa do con- 
versor A/D e o tempo de processamento do código for um “gargalo” na imple- 
mentação, recomenda-se utilizar um hardware com RTOS (Real Time Operation 


System), em que se pode criar tarefas múltiplas com prioridades diferentes. 


£ Exemplo 10.5: Considere um controlador PI digital dado pela seguinte função de 


transferência: 
12, 777779z — 12, 22221 


z=1 É 


com período de amostragem igual a Ts = 0,02 segundo. Escreva um pseudocódigo para 


Cl) = 


esse controlador. 
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Apéndice A 


Controlador PID em Tempo 


Continuo 


O controlador proporcional-integral-derivativo (PID) é, de longe, o tipo de controle 


mais utilizado na indústria. Sua forma paralela é apresentada na Figura A.1. 


Cio Exa 
processo 


Figura A.1 — Controlador PID na forma paralela. 


Os parâmetros Kp, Kr e Kp são denominados ganho proporcional, ganho integrativo 


e ganho derivativo, respectivamente. A ação de controle é dada por 


t 


u(t) = Kpe(t)+ Kr fo dr + Kp -d 
0 
He) Kp +! + Kps. (A.1) 


Outra forma de estrutura de controle PID é apresentada na Figura A.2. Tal esquema 


285 
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é um caso particular da forma ISA, sendo mais usual. Note que 


meg ré vo 


Figura A.2 — Controlador PID ISA. 


u(t) = Kp («0 +3 / ar ar+ Too), 
U(s) 1 
E(s) Kp(1 + Trs + Tps). (A.2) 


onde Tp é denominado tempo derivativo e Tr tempo integrativo (reset time). Ao com- 
parar as Equações (A.1) e (A.2), observa-se que K; = Kp/Tr e Kp = KpTp, ou seja, 
Kp e Kr dependem de Kp. 

O aumento do ganho proporcional acelera a resposta, pois, quanto maior o erro, maior 
será o termo proporcional de compensação. O aumento de Kp tende ainda a diminuir os 
erros em regime permanente, além de reduzir os efeitos dos distúrbios e a sensibilidade à 
variação de parâmetros na planta. Porém não rejeita completamente distúrbios, e erros 
em estado estacionário geralmente irão persistir. Além disso, ganhos elevados podem 
levar o sistema à instabilidade. 

A ação integral acelera o movimento do processo em direção ao set-point, eliminando 
(ou diminuindo) o erro residual que ocorre com controlador puramente proporcional 
(insere polo na origem aumentando o tipo do sistema de um). Como o termo integral 
isolado acumula erros do passado, valores elevados para Ky; provocam o efeito colateral 
de aumento no sobressinal. 

Em um sistema prático é comum a ocorrência de saturação no atuador. Quando 
ocorre a saturação e a saída da planta não atinge o set-point, a saída do termo integrativo 
do controlador cresce cada vez mais, mesmo que a saída física já tenha saturado. Assim, o 
erro acumulado pelo integrador fica muito elevado. Tal fenômeno é denominado windup. 
O problema não é o windup em si, mas a volta do sistema a uma condição normal 
após algum tempo em saturação. Se o erro acumulado no integrador for alto, o sistema 


demorará muito para corrigir O erro. 
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Para evitar que isso ocorra, deve-se utilizar um esquema denominado anti-windu 
> ? 
que limita ou “congela” a ação integrativa quando o sistema entra em saturação, evitando 
o acúmulo de erro indesejável no integrador. Uma forma muito utilizada de PID com 


anti-windup é representada na Figura A.3. 


Figura A.3 — Controlador PID com anti-windup. 


A diferença entre a entrada e a saída do atuador (e,,) é realimentada para a entrada 
do integrador, passando pelo ganho 1/T,. Quando há saturação, este sinal impede que 
o integrador acumule erros indesejados. T, é a constante de tempo de atracamento do 
anti-windup. Uma regra prática consiste em assumir Tp < T, < Ty (por exemplo, 
T; = vT¡Tp) [Ástróm e Wittenmark 1997]. 

Para utilizar o anti-windup em um sistema prático, deve-se inserir na malha um 
modelo de saturacáo do atuador. 


Considere isoladamente agora a ação derivativa, tal que 
U(s) = KpTpsE(s). (A.3) 


Note que se tem uma função de transferência não própria. Além disso, o termo 
derivativo possui um ganho que cresce com o aumento da frequência, e o sistema fica 
extremamente sensível a ruídos de alta frequência. Para evitar tal problema, pode-se 


escrever o termo derivativo em uma forma realizável, tal que 


E(s), (A.A) 


onde N é um parâmetro tipicamente adotado entre 3 e 20. Essa forma acrescenta um 
polo em —N/Tp. Além de tornar a função de transferência própria, o ganho da parcela 
derivativa é saturado a partir de w = N/Tp. As respostas em frequência das parcelas 
derivativas para os casos com derivada pura e com polo adicional são ilustradas na Figura 
A.A. 
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| l | qwT 
20 log, (N) 


Figura A.4 — Comparação da resposta em frequência do termo derivativo. 


Para variações abruptas na referência, a ação de controle derivativa contribui com 
um valor de amplitude muito elevado (kick derivativo). Para amenizar este problema, a 
parcela derivativa pode atuar diretamente na realimentação de saída, com sinal trocado, 
o que resulta na seguinte ação de controle: 

Rs Tps 

(Tp/N)s+1 


U(s) = Y(s). (A.5) 


O diagrama do controle PID realizável com anti-windup e derivada da saída é repre- 


sentado na Figura A.5. 


Figura A.5 — Controlador PID realizável com anti-windup. 


Os efeitos independentes dos ganhos Kp, Kr e Kp na resposta de malha fechada do 


sistema são resumidos na Tabela A.1. 
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Tabela A.1 — Efeitos dos parámetros Kp, Kr e Kp em um controle PID. 


b; UP: bs Cag Estabilidade 
+ Kp Decresce Aumenta Aumenta pouco  Decresce Degrada 
+ Kr Decr. Pouco Aumenta Aumenta Decr. Muito Degrada 


+ Kp Decr. Pouco Decresce Decresce Influi Pouco Melhora* 


* Deve-se ficar atento quando há componentes de ruído de altas frequências. 


Apéndice B 


Simulacao de Sistemas de Controle 
Digital no MATLAB /Simulink 


O MATLAB/ Simulink® será utilizado para simulação de sistemas de controle digi- 
tais. Este suplemento explica o procedimento a ser utilizado, com base em um exemplo 
de aplicação. 

Considere o Exemplo 6.1, cujo diagrama em malha fechada é apresentado na Figura 
Bi. 


Figura B.1 — Sistema de controle do Exemplo 6.1. 


O controlador projetado em tempo contínuo, sem considerar o efeito do ZOH, é dado 


por: 
(s +0,3) 


= 1 1 TAS 
a i 5973F 3, 628) 


(B.1) 


Para simular este sistema em tempo contínuo, o seguinte código em MATLAB® foi 


utilizado: 
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clear ally close alls cle; 

s = tfi('s'); G = 1/(s*(st0.3)); XG(s) 

num_G = G.num{:}; /Colocar no numerador da F.T. da planta 

den_G = G.den{:}; %Colocar no denominador da F.T. da planta 

C = 13.159*(s+0.3)/(s+3.628); %C(s) 

num C = C.num{:}; %Colocar no numerador da F.T. do controlador 
den C = C.den{:}; YColocar no denominador da F.T. do controlador 
t_run = 6; %Colocar no simulation stop time do SIMULINK 

t_step = 1; %Colocar no parâmetro step time do bloco step 
sim('controle_01'); /Executa o arquivo controle 01 do SIMULINK 


subplot (121); pi = plot(tout, r» 'k--',tout,y,'k'); /Gráfico de saída 
xlabel(t (s)); ylabel (Amplitude) ; 
leg = legend('Referéncia','Resposta') ; 


subplot (122); plot(tout, u,'k'); %Grafico do sinal de controle 
label Cs) ig ylabed Cult) "Jg 


O diagrama referente ao arquivo controle 01.slx do Simulink® é apresentado na 


Figura B.2. O resultado obtido está apresentado na Figura B.3. 


To Workspace1 


To Workspace2 


Figura B.2 — Diagrama da simulação em tempo continuo. 


Para a simulação do sistema de controle digital, inicialmente será considerada a abor- 
dagem utilizando uma função de transferência discreta no Simulink®. Para discretização 
do controlador, utilizou-se o método casamento polo e zero, com período de amostragem 
igual a 0,2 segundo. Para o projeto do controlador, o efeito do atraso do ZOH foi inserido 
na planta por uma aproximação Padé de primeira ordem (vide Exemplo 6.6.1). A função 


de transferência discreta obtida para o controlador é dada por 


(z — 0,9418) 


Cla) = 9, 7656 a, 
(2) = 9, 7656 "5 3203) 


(B.2) 
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Amplitude 


- — — Referência 
Resposta 


t (s) t (s) 
Figura B.3 — Resultado da simulação em tempo contínuo (saída e sinal de con- 


trole). 


O seguinte código em MATLAB® foi utilizado: 


clear all; close all; ele; 


Ts = 0.2; %Inserir nos blocos zoh e na F.T. discreta do controlador 
s = tf('s'); G = 1/(s+(s+0.3)); KG(s) 
num G = G.num{:}; %Colocar no numerador da F.T. da planta 


den_G = G.den{:}; %Colocar no denominador da F.T. da planta 

C = 15.877*(s+0.3)/(s+5.693); KC(s) com efeito do ZOH 

C_d = c2d(C,Ts,'matched'); %Equiv. discreto 

num_C_d = C_d.num{:}; /Numerador da F.T. do controlador digital 
den_C_d = C_d.den{:}; /Denominador da F.T. do controlador digital 
t_run = 6; %Colocar no simulation stop time do SIMULINK 

t_step = 1; /Colocar no parâmetro step time do bloco step 
sim('controle_02'); /Executa o arquivo controle 02 do SIMULINK 
subplot (121); pi = plot(tout, r, 'k--',tout,y,'k'); /Gráfico de saída 
xlabel('t (s)'); ylabel('Amplitude') ; 

leg = legend('Referéncia','Resposta') ; 

td = 0:Ts:Ts*(length(u)-1); %/Vetor de tempo discreto 

subplot (122); stairs(td, u,'k'); /Gráfico do sinal de controle 
xlabel('nT_s (s)'); ylabel('u(nT_s)'); 


O diagrama de simulação do arquivo controle 02.slx do Simulink® é apresentado 


na Figura B.4. O resultado obtido está apresentado na Figura B.5. 


294 Controle Digital Aplicado 


To Workspace2 


num(z) 


den(z) 


Zero-Order To Workspace 


Hold1 


Zero-Order 
Hold3 


To Workspace1 
Zero-Order 
Hold2 


Figura B.4 — Diagrama da simulação em tempo discreto. 


1.2 10 - r 
1 
o 0.8 5f 1 
o A 
E S 
H 06 E 
= 3 
= 0.4 0 
= — — Referência 
0.2 Resposta 
0 5 , i 
0 2 4 6 
nT; (s) 


Figura B.5 — Resultado da simulação em tempo discreto (saída e sinal de con- 


trole). 
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A seguir será apresentada a metodologia adotada neste livro. A ideia consiste em 
programar o bloco do controlador digital utilizando a equação de diferenças que descreve 


sua dinâmica. Nota-se que, para o controlador digital considerado, 
u[n] = Buln — 1] + K.(e[n] — ae[n — 1)), (B.3) 


com Ke = 9,7656, a = 0,9418 e 8 = 0,3203. A equação de diferenças que representa o 
controlador será implementada em uma estrutura denominada Matlab Funtion, conforme 


a Figura B.6 (diagrama controle 03.slx do Simulink®). 


Data Store Data Store 


Memory Memory? To Workspace 


Zero-Order 
Hold3 


Zero-Order To Workspace1 


Hold 
MATLAB Function 


To Workspace2 


Zero-Order 
Hold1 


Figura B.6 — Diagrama da simulação em tempo discreto — método 2. 


Ao clicar duplamente sobre o bloco, conforme apresentado na Figura B.7, abre-se o 
arquivo para edicáo da funcáo, exatamente como uma funcáo qualquer do MATLAB®, 


permitindo definir mais de uma entrada e mais de uma saída, caso necessário. 


MATLAB Function 
F i 
function u = fcn(e,param) 


ck: controle 03 


MATLAB Function 


ES 
aS 
o ch global u ant; global e ant; 
A 4 — a = param(1); b = param(2); K = param(3); 
Ss si u = b*u + K*e - K*a*e ant; 


E 1 ant = u; e ant = ez 


MATLAB Function 


Figura B.7 — Acesso ao código do bloco Matlab Function. 


Para configurar a função, deve-se clicar em edit data. O primeiro passo é escolher o 
método de atualização da Matlab Function. Nesse caso, será tempo discreto, com período 


de amostragem T's, conforme a Figura B.8. 
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Edit Add 

OFf 
Name Scope 

sis) e Input 1 

sis) u Output 1 O 


Tools 


Port Resol 


Support variable-size arrays 
E Saturate on integer overflow 


[C] Lock Editor 


Treat these inherited Simulink signal types as fi objects: Fixed-point 
MATLAB Function fimath 


@ Same as MATLAB O Specify Other 


Figura B.8 — Método de atualizacáo da Matlab Function. 


Uma nova variável incluída na chamada de uma funcáo dentro do bloco Matlab 
funtion será inicialmente configurada como do tipo input. Por outro lado, algumas vezes, 
o usuario desejará passar parámetros constantes para a funcáo a partir, por exemplo, de 
variáveis contidas no espaco de trabalho do MATLAB®. Para que isso seja possivel, 


alguns passos de configuracáo sáo necessários: 
e Defina a variável que deseja passar para a funcáo na sua chamada. 


e Abra o editor “Edit Data/Ports”. 


e Selecione a opção “Parameter” no campo “Scope” e elimine a seleção “Tunable” 
(Figura B.9). 


Edit Add Tools 


WHF fe E 


x te 


A 
Name Scope 


leio) e 


sio) u 


Input 
Output 


Port R 


Data param 


General Description 


Name: 


param Parameter 
Scope: 


Size: 


Complexity: Inherited 


Type: | Inherit: Same as Simuliini 


Figura B.9 — Seleção do tipo de entrada da Matlab Function como parâmetro 


externo. 
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A variável param agora é, na realidade, uma constante cujo conteúdo está definido 
no espaco de trabalho do MATLAB/Simulink®. 

Note ainda que no conteúdo da Matlab Function (Figura B.7) o sinal de erro e 
o sinal de controle sáo salvos nas variáveis e_ant e u_ant, para serem utilizados na 
próxima iteracáo do algoritmo. Para fazer isso dentro da Matlab Function, o seguinte 


procedimento pode ser considerado: 


e Defina a(s) variável(is) como global(is) dentro da Matlab Function. 


e Abra novamente o editor “Edit Data/Ports”. Clique em “Add data” (Figura B.10) 
e defina a variável com o mesmo nome da variável global definida no código da 


funcáo (Figura B.11). 
e Selecione a opcáo “Data Store Memory” no campo “Scope” (Figura B.11). 
e Repita o procedimento para as demais variáveis globais utilizadas como memória. 
Edit Add Tools 
15 


MATLAB Function: MATLAB Function 
Name: MATLAB Function 


Update method: Discrete ” | Sample Time: 


E support variable-size arrays 

Saturate on integer overflow 

[C] Lock Editor 

Treat these inherited Simulink signal types as fi objects: Fixed-point 
MATLAB Function fimath 


@ Same as MATLAB O Specify Other 


fimath(RoundingMethod', ‘Nearest’, 


Figura B.10 — Inserção de um novo dado para a Matlab Function. 


Para finalizar, no diagrama do Simulink® deve-se adicionar um bloco “Data Store 
Memory” para cada variável que será armazenada. Ao clicar duplamente no bloco, na 
aba “main” deve-se definir o nome da variável a ser armazenada (mesmo nome definido 
na Matlab Funtion). Na aba “Signal Attributes” deve-se fazer a configuração apresentada 
na Figura B.12. 


Na aba “Diagnostics”, desabilite todos os “warnings”, como mostrado na Figura B.13. 
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Edit Add Tools 

OF Kk 4208 th 
Scope ^ Data u_ant 
Data Store Memory General 
Input 


Name: 


Output 


Parameter 
O variable size 


Figura B.11 — Seleção do tipo de dado da Matlab Function como elemento ar- 


mazenador de memoria. 


*& Block Parameters: Data Store Memory 


DataStoreMemory 


Define a memory region for use by the Data Store Read and Data Store 
Write blocks. All Read and Write blocks that are in the current 
(sub)system level or below and have the same data store name will be 
able to read from or write to this block. 


Main Signal Attributes Diagnostics Logging 


Initial value: [o 


Minimum: io ] Maximum: [o 


Lock output data type setting against changes by the fixed-point tools 


mensions (-1 to infer from Initial value): |-1 


grameters as 1-D 


Data store name must resolve to Simulink signal object 


Package: |--- None --- X Refresh 


Storage class: Auto 


Figura B.12 — Configuração dos atributos de sinais do “Data Store Memory”. 
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“a Block Parameters: Data Store Memory 


DataStoreMemory 


Define a memory region for use by the Data Store Read and Data Store 
Write blocks. All Read and Write blocks that are in the current 
(sub)system level or below and have the same data store name will be 
able to read from or write to this block. 


Main Signal Attributes Diagnostics Logging 
Detect Read Before Write: none 
Detect Write After Read: | none 


Detect Write After Write: none 


Figura B.13 — Desabilitação dos alertas do bloco “Data Store Memory”. 


Com isso, a simulação é efetuada diretamente com a equação de diferenças. Para 
efetuar a simulação, o script a seguir foi desenvolvido. O código da Matlab Function está 


apresentado na Figura B.7. O resultado obtido é idêntico ao da Figura B.5. 


clear all; close all; cic; 


Ts = 0.2; %Inserir nos blocos zoh e na F.T. discreta do controlador 
s = tf('s'); G = 1/(s*(s+0.3)); KG(s) 
num G = G.num{:}; %Colocar no numerador da F.T. da planta 


den_G = G.den{:}; /Colocar no denominador da F.T. da planta 

C = 15.877*(s+0.3)/(s+5.693); KC(s) ajustado para considerar o efeito ZOH 
C_d = zpk(c2d(C,Ts,'matched')); 

alpha = C_d.z1f1); %Captura o zero da F.T. discreta do controlador 
beta = C_d.pt1); %Captura o polo da F.T. discreta do controlador 

Ke = C_d.k; %Captura o ganho da F.T. discreta do controlador 

param = [alpha, beta, Kc]; 

t_run = 6; %Colocar no simulation stop time do SIMULINK 

t_step = 1; %Colocar no parâmetro step time do bloco step 
sim('controle_03'); hExecuta o arquivo controle 03 do SIMULINK 
subplot (121); pi = plot(tout, r, 'k--',tout,y,'k'); /Gráfico de saída 
xlabel('t (s)'); ylabel ('Amplitude'); 

leg = legend('Referéncia','Resposta') ; 

td = 0:Ts:Ts*(length(u)-1); /Vetor de tempo discreto 

subplot (122); stairs(td, u,'k'); /Gráfico do sinal de controle 
xlabel('nT_s (s)'); ylabel('u(nT_s)'); 


Apêndice C 


Modelagem de Sistemas Mecanicos 
no MATLAB /Simulink 


A modelagem de sistemas mecánicos apresentada aqui será feita considerando o mé- 
todo de Lagrange. Nesta abordagem, ao invés de se trabalhar com acelerações (Newton), 
as expressões envolvem a energia (cinética e potencial). No entanto, no final, os mesmos 
resultados são obtidos. 

No método de Lagrange deve-se definir, inicialmente, um conjunto de variáveis ge- 
neralizadas, qn, n = 1, ..., N, que represente os N graus de liberdade do sistema. Os 
graus de liberdade são tipicamente coordenadas de posição (distâncias ou ângulos). 

Em termos das coordenadas generalizadas, definem-se a Energia Cinética K e a 
Energia Potencial U. Em geral, K é uma função definida em função de qn e qn. Por 
outro lado, U é definida em função de qn. 

Em sistemas multicorpos pode-se, por exemplo, definir K e U para cada corpo sepa- 


radamente e, depois, combiná-las. Com K e U, define-se então a Lagrangiana 


L=kK-U, (C.1) 

sendo L(q1, G2, -.., Gn, (1, G2; ---, Gn, t). As equações de Euler-Lagrange são dadas por 
d (OL OL 

Em nella 2 

dt ta o e” o 


em que 7, são as forças generalizadas (força ou torque) na n-ésima direção. 
Com o método de Lagrange, uma vez que as energias cinéticas e potenciais es- 
tejam calculadas, as equações de movimento são obtidas a partir de (C.2). Seja 
T 


aS E ne an] , a solução de (C.2) pode ser escrita na seguinte forma compacta: 
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M(q)q a V(a, a) a G(a) = Teq; (C.3) 


em que M(q) € R”*” é a matriz simétrica positiva definida denominada matriz de inércia, 
V(q, à) € R” é o vetor de forças centrípetas e de Coriolis, G(q) € R” representa o vetor 
de termos gravitacionais, e Teg € R” compreende o termo de forças generalizadas (forças 
e torques externos e de atrito). 


A partir de (C.3), pode-se escrever 
4 = M”*(9) [Tea — V(a, å) — G(a)). (C.4) 


Neste Apéndice, o péndulo rotacional (péndulo de Furuta) e o péndulo com roda de 
reação sao modelados utilizando o método de Lagrange. Além disso, serão apresentados 


os códigos MATLABO de obtencáo dos modelos das plantas mencionadas. 


C.1 Matrizes de rotação 


São matrizes quadradas que mudam a direção do vetor, mas sem alterar sua magni- 


tude, ou seja, são matrizes unitárias. 


Matriz de rotação em duas dimensões 


Considere as representações da Figura C.1. 


Y» 


Figura C.1 — Matriz de Rotação no R?. 


Pode-se descrever a orientação do sistema de coordenadas {B} em relação ao {A} 
representando os versores dos eixos de {B} em relação a {A}. Assim, o sistema {B} é 
expresso no sistema {A} pela transformação (matriz de rotação) 4R, tal que 


0 
2] ei 


Rotg Rotg 


4R=|*% so] = 
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onde Rotg representa uma rotação no sentido anti-horário por um ângulo 0. Assim, 


verifica-se que 


Co —Sp 
$R= | | , (C.6) 
So cg 
em que cy e Sg são acrónimos para cos(0) e sen(0), respectivamente. 
Para expressar {A} no sistema {B}, basta utilizar FR = R71. Como a matriz de 


rotação é unitária, tem-se que AR! = 4R". 


Matrizes de rotação em três dimensões 
No espaço, as rotações podem ser em torno dos eixos x, y, ou z. Seja a representação 
da Figura C.2. Observe que na direção x, os versores de {B} e {A} coincidem. Assim, o 


sistema {B} pode ser expresso no sistema {A} utilizando a seguinte matriz de rotação: 


E, 


Figura C.2 — Matriz de rotação no R°, em torno de x. 


1 0 0 
AR = [sx ay, | = ol Rote |1| Rote l0 
0 0 1 
10 0 
= |0 co -sol. (C.7) 
O so co 


Considere a representação da Figura C.3. Neste caso, os versores de {B} e {A} 
coincidem na direção y. Logo, o sistema {B} pode ser expresso no sistema {A} utilizando 


a seguinte matriz de rotação: 
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Figura C.3 — Matriz de rotação no RÌ, em torno de y. 


1| Jo 0 
AR = E ag, #5] = Roto Jo] |1| Rote lo 
ol lo 1 
co O so 
= if 1% (C.8) 
—so O co 


Por fim, considere a representação da Figura C.4 em que, na direção z, os versores 
de {B} e {A} coincidem. Assim, o sistema {B} pode ser expresso no sistema {A} 


considerando a seguinte matriz de rotagao: 


1 0 0 
AR = E a}, aż] = |Roto |0| Roto |1| lo 
0 0 1 
Co —Sg 0 
= So cg 0 (C.9) 
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Figura C.4— Matriz de rotação no RÌ, em torno de z. 


C.2 Modelagem do pêndulo de Furuta 


O pêndulo de Futura, ou pêndulo invertido rotacional, proposto em 1992 por Kat- 
suhisa Furuta e pesquisadores associados a ele no Tokyo Institute of Technology, consiste 
em um braço atuado que rotaciona no plano horizontal com um pêndulo acoplado em 
uma de suas extremidades [Furuta, Yamakita e Kobayashi 1992]. Considere o diagrama 


esquemático da Figura C.5. 


Rotação em 1 
torno de x 


{f} Rotação em y 
,| torno de z 


Figura C.5 — Diagrama do pêndulo de Furuta. 
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As variáveis do braço e o do pêndulo são referenciadas com índices 0 e 1, respec- 
tivamente. O sistema inercial {f} está fixo no eixo de rotação do braço. Na mesma 
posição, mas solidário ao braço, é fixado o sistema {0}. Na extremidade oposta ao braço 
e solidário ao pêndulo, é fixado o sistema {1}. A posição do centro de massa do i-ésimo 


corpo é representada por cmi. Os parâmetros do sistema são descritos na Tabela C.1. 


Tabela C.1 — Parâmetros da construção do pêndulo 


Parâmetro Valor 

Mo | Massa do braço [kg] 0,120 

Mı | Massa do pêndulo [kg] 0,076 
Lo | Comprimento do braço [m] 0,26 
Lı | Comprimento do pêndulo [m] 0,25 
r | Distância eixo-base até pêndulo [m] 0,25 


Dist. eixo-base até o centro de massa do braço [m] | 0,18 


g | Aceleração da gravidade [m/s?] 9,81 
K, | Constante de torque do motor [Nm/A] 0,118 
Ke | Constante de velocidade do motor [V/(rad/s)] 0,118 
Rm | Resistência de armadura do motor [9] 3,6 


bo, bi | Coefs. de atrito juntas base-braço e braço-pêndulo | determinar 


De forma genérica, a matriz de momento de inércia do i-ésimo corpo é dada por 


py 
=| qe P| (C.10) 
Te E p 


Considerando que o braço e o pêndulo são constituídos por barras simétricas e ba- 


lanceadas, tem-se que 


ir 0 0 
Z=|0 I ol. (C.11) 
0 O If 


Adicionalmente, de forma simplificada, será considerada a componente do momento 
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de inércia apenas no sentido da rotação principal do i-ésimo corpo, ou seja, 


00 0 mE $09 
s=l. © |, =| o on, (C.12) 
0 o vol 0 00 


em que ambos braço e pêndulo foram considerados como barras ideais de massa M; e 
comprimento L;. A velocidade angular do braço wọ é composta pela rotação do eixo 


anterior (fixo) no corpo somada à rotação do próprio corpo, ou seja, 


0 
wm=R'|o|+|0/=|0|. (C.13) 
do do 


+ 
A velocidade translacional na junta base-braço é vo = ÍRT jo 0 o] . Assim, a 


velocidade do centro de massa do braço é dada por 


d 
Vemo = Vo + Wo X |0]. (C.14) 
0 


Observe que o centro de massa do braço está a uma distância d do seu eixo de rotação. 
Similarmente, a velocidade angular do péndulo w; é composta pela rotação do eixo 


anterior (braço) somada à rotação do próprio pêndulo, ou seja, 


ĝa 
wi =IR'wo+|0|. (C.15) 
0 


A velocidade translacional na junta braço-pêndulo é dada por 


a 
vi =2R' | wox lol |, (C.16) 
0 


em que r é a distância da junta braço-pêndulo à junta base-braço. Por fim, a velocidade 


do centro de massa do pêndulo é dada por 


0 
Vemi = V1 +01 X 0 5 (C12) 
1/2 


308 Controle Digital Aplicado 


em que o centro de massa do péndulo está a uma distância Lı /2 do seu eixo de rotação. 
Com as velocidades obtidas, as energias cinéticas e potenciais dos corpos podem ser 


calculadas. Para o braço, verifica-se que 


1 1 
Ko = 5 (wo Towo) + 5 (VémoMoVemo) - (C.18) 
Para o pêndulo, tem-se 
1 1 
Ki=5 (wlw) + 5 (Vena Mi Vem) - (C.19) 


De acordo com a convenção adotada, a energia potencial do braço é nula e a do 


péndulo é dada por 
= Migl, cos(01). (C.20) 


Com K = Ko + Ki eU, aplica-se (C.2) para obter as equações de movimento na 
forma (C.3) ou na forma (C.4), considerando q = loo 01] A 

Em relação a Teq, na junta do braço há o efeito do torque aplicado pelo motor DC 
e o dissipado pelo atrito viscoso da junta. Sabe-se que o torque Tm gerado pelo motor é 


proporcional à corrente im de armadura !, ou seja, 


Tm = Keim: An) 


Ao desprezar a indutáncia de armadura, a equacáo do motor DC alimentado por 


armadura é dada por 
Um = Rmim + Kebo, (C.22) 


sendo o termo K-69 devido à força contro-eletro-motriz (f.c.e.m.). Como o motor tem 
tensáo nominal de 12 V, e considerando acionamento com driver tipo ponte-H e sinal 
PWM, tem-se que 

Um = 12u, (C.23) 


e que u € [-1, 1] é o sinal de controle calculado pelo microcontrolador que considera o 
ciclo ativo do sinal PWM e o sentido de rotação do motor. Com isso, de (C.21), (C.22) 
e (C.23), tem-se que 


K, . 
Tm = Be (12u = Ko) (C.24) 
Logo, o vetor Teq pode ser escrito como 
K: j ; 
— (12u — Ke0 —bod 
Tea = | Rm ( o) + | Al (C.25) 
0 —0101 


1 Aqui já é considerado o efeito da redução. 
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onde o termo b,0; é devido ao atrito viscoso na i-ésima junta (i = 0: base-braço, i = 
1: braço-pêndulo). O termo b; deve ser estimado experimentalmente. Assim, pode-se 
controlar o sistema tendo o sinal u como entrada. Para isso, basta encontrar as equações 
do movimento em função de Teq e, em seguida, substituir Teq conforme a Equação (C.24). 

A modelagem completa é apresentada no código MATLAB® a seguir. O arquivo 
Gera Modelo Furuta.m gera M, V, g e Teq, e os salva como funções, na pasta de tra- 
balho atual, para posteriormente serem importados no arquivo Simulink de simulação 
com o modelo não linear. Tais funções são respectivamente exportadas com os seguintes 
nomes: function M Furuta.m, function V Furuta.m, function G Furuta.m e func- 
tion tau eq Furuta.m. As matrizes do modelo linear em tempo contínuo, A, B, Ce 
D, são exportadas no arquivo Modelo Furuta.mat. 

O arquivo Gera Modelo Furuta.m usa a função externa deriv.m para calcular a 


derivada parcial de f em relação a g = g(t). 


clear all; cle; close all; 
Parametros mecânicos 
d = 0.18; KPosição do CM do braço 


MO = 0.120; Massa do braço 

Mi = 0.076; Massa do péndulo 

LO = 0.26; Comprimento do braço 

Li = 0.25; Comprimento do pêndulo 

IO = 6.7600e-04; Momento de Inércia braco 

I1 = 3.95833e-04; YMomento de Inércia péndulo 

r = 0.25; /Distáncia da junta do braço à junta do pêndulo 


b0=0; b1=0; %Coefs de atrito viscoso das juntas de braço e péndulo 
Parámetros do motor 

Rm = 3.6; %Resisténcia da armadura 

Ke = 0.118; /Cte de f.c.e.m. (já considera a redução) 

Kt = 0.118; /Cte de torque (já considera a redução) 
hVariáveis de posição, velocidade e aceleração angulares 
syms: t thO(t) thi(t) g; 

tho = th0(t); thi = thi(t); KPosição 

wthO = diff(th0,t); wthO_d = diff(wth0,t); %Velocidade 
wthi = diff(th1,t); wthi_d = diff(wth1,t); /Aceleracáo 
Matrizes de Inércia 

IO mat = diag([0;0;10]); 

Ii mat = diag([11;0;0]); 

WhMatrizes de rotação 

RO = [cos(th0) -sin(th0) O; sin(th0) cos(th0) 0; 0 O 1]; 
Ri = [1 0 0; O cos(th1) -sin(thi); O sin(thi) cos(thi)]; 
//Cálculo das velocidades 

braco 

vö = RO.**D0:0:,07 + [Os O; wthO]; 
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vem0 = K0.'+[0;0;0] + cross (wO,[d;0;0]); 

hPendulo 

wi = R1.'*w0 + [wthi; 0; 0]; 

vi = R1."*crose(w0,[r; O; 0]); 

vemi = vi+cross(w1,[0; 0; L1/2]); 

hhCálculo das Energias e Lagrangiana 

“Energia Cinética do Braço 

KO = 1/2*(wO.' * IO mat * wO) + 1/2x*(vcm0.' * MO * vcm0); 
“Energia Cinética do Péndulo 

K1 = 1/2*(w1.' * Ii mat * wi) + 1/2*(vcm1.' * Mi * vemi); 
Energia cinética total 

K = KO+K1; 

YEnergia potencial total 

U = Mix*g*L1/2*cos(th1); 

hLagrangiana 

Lagr = K - U; 

NhEqs. de Euler-Lagrange 

%dLag\d(wthO). deriv(f,g(t)) faz a derivada parcial de f em relação a g(t) 
LqqO = deriv(Lagr, wth0); 

na (dLag\d(wth0O))\dt 

Lgqt0 = diff(Lqq0, t); 

%adLag\dtho 

LqO = deriv(Lagr, th0); 

na (dLag\d(wth0O))\dt - dLag\dtho 

LeqO = simplify(expand(Lqqt0 - Lq0)); 

%dLag\d(wth1) 

Lqqi = deriv(Lagr, wth1); 

%a(dLag\d(wth1))\dt 

Lagti = diff(Lqqi, t); 

“%dLag\dthi 

Lqi = deriv(Lagr, thi); 

“%a(dLag\d(wthi))\dt - dLagidthi 

Leqi = simplify (expand(Lqqt1 - Lq1)); 

Como as derivadas já foram feitas, vamos substituir as variáveis 
Com dependência temporal por variáveis que não dependem do tempo, pois o 
Problema agora consiste em resolver equações algébricas 
syms THO THi WTHO WTH1 WTHO d WTH1 d 


LeqO_ = subs (Leqg0,wth0O d,WTHO d); 
LeqO_ = subs(Leq0_ ,wthi d,WTH1 d); 
LeqO_ = subs (Leg0. ,wthO,WTHO); 
LeqO_ = subs(Leqg0. ,wthi,WTH1); 
LeqO_ = subs (Leg0. ,th0,THO); 

Leg0_ = subs(Leq0O_,thi,TH1) ; 

Leqi_ = subs (Leqgi,wthO d,WTHO d); 
Leqi_ = subs(Leqi_,wthi_d,WTH1_d) ; 


Leqi_ = subs(Leqi_,wth0,WTHO) ; 
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Leqi_ = subs(Leqi_,wthi,WTH1) ; 
Leqi_ = subs(Leq1_ ,th0,THO); 
Leqi_ = subs(Leqi_,thi,TH1) ; 


hhEquações de Movimento 

syms tau eq. 0 tau_eq_1 u htau eq. i são as forças generalizadas e u é um 
hsinal de -1 a 1 representando o ciclo ativo do 

PWM do motor e o sentido de rotação 

tau eq = [tau eq. 0; tau eq. 1]; 


“Eqs. de Euler Lagrange reagrupadas 


s0 = LeqO_ - tau_eq_0; 
si = Leqi_ - tau_eq_1; 
s=[s0; si]; 


syms q q_p q. PP 

q=[THO; TH1]; %Vetor de posições angulares (coordenadas generalizadas) 
q-p=[WTHO; WTH1]; %Vetor de velocidades angulares 

q_pp=[WTHO_d; WTH1_d]; /Vetor de acelerações angulares 

%Modelo Reduzido 

M=simplify(expand(jacobian(s,q_pp))); %Matriz de Inércia 

G=simplify (expand(jacobian(s,g)*g)); hvetor de termos gravitacionais 
V=simplify (expand(s-M*q_pp-G+tau_eq)); %Vetor de fç centripeta-Coriolis 
G = subs(G,g,9.81); 

tau_m = Kt*(12*u-Ke*WTHO)/(Rm); /Equagáo do motor DC 

tau eq. 0 = tau_m - bO*WTHO; %Torque de atrito da junta do braço 

tau eq. 1 = -bi*WTH1; /Torque de atrito da junta do péndulo 

tau eq = subs(tau eg); 

hM, V, G e tau eq são exportados como funções 


para serem carregadas no modelo não linear do Simulink 


matlabFunction(M,'File','function_M_Furuta'); 
matlabFunction(V,'File','function_V_Furuta'); 
matlabFunction(G,'File','function_G_Furuta'); 
matlabFunction(tau_eq,'File','function_tau_eq_Furuta'); 


hEquações de Movimento 

xpp = simplify(expand(M”-1*(tau_eq-V-G))); 
WhLinearização do Modelo 

hVariaveis de estado 

x = [THO;TH1;WTHO;WTH1]; 

xp = [WTHO; WTH1; xpp(1); xpp(2)]; 
WhLinearização 

Am=jacobian(xp,x); Bm=jacobian(xp,u); 
%Ponto de equilíbrio 

THO=0; TH1=0; WTHO=0; WTH1=0;u=0; 

A double (subs (Am)); B = double (subs (Bm)); 
c = [1 0 0 0]; D = 0; 

save ("Modelo_Furuta,.mat',"A',"B"', "ce", "D"); 
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function out = deriv(f, g) 

hFunção para derivada parcial de f em relação a g=g(t) 
syms t x dx 

a = fg, ditt(g, t)}; 

b = fx, del; 

sube(t, as Db); 

diff (f1, x); 

out = subs (f2, b, a); 


h Fh 
N e 
| | 


O modelo não linear do sistema é programado no Simulink®, conforme a Figura C.6. 
Observe que M, V, g e Teq sao carregados no código da Matlab Function para gerar as 


equações de movimento. 


Integrator 


MATLAB Function1 


Modelo Furuta 
(Vide Apéndice C) 


function x_p_out = fcn(u,x in) 


x in(1); TEL = x_ini(2); 
x in(3); WTH1 = x in(4); 


M, V a E e 
M, V, G, tau_eg 


= function_M Furuta (TH1); 

= function V Furuta (TH1,WTHO, WTH1); 

= function G Furuta (TH1); 

_eq = function tau eg Furuta (WTHO,u); 
xp = M^ (-1)* (tau_eq-V-G) ; Eq. de moviment 
xl_p = WTHO; x2_p = WTH1; x3_p = xp(1); x4 = xp(2); 
x_p_out = [xl_p; x2_p; x3_p; x4_p]; “Saída: vetor x por 


Figura C.6 — Simulador do pêndulo de Furuta no Simulink®. 


Modelagem de Sistemas Mecânicos no MATLAB/Simulink 313 


C.3 Modelagem do péndulo com roda de reação 


O péndulo com roda de reação [Block, Ástróm e Spong 2007] é formado por uma 
haste e uma roda posicionada na sua parte superior (chamada de roda de reacáo). Seu 
funcionamento consiste em utilizar a reacáo do torque aplicado na roda para atuar na 
haste e, assim, equilibrar o péndulo. Considere o desenho esquemático da Figura C.7 


com os sistemas de coordenadas fixos em cada corpo. 


Figura C.7 — Diagrama do péndulo com roda de reacáo. 


Os parámetros de construção do pêndulo são dados na Tabela C.2. Idealmente, 
deseja-se que a roda de reacáo tenha uma massa muito pequena e um momento de 
inércia elevado. Logo, a geometria utilizada é a de um anel com raio interno Rj e raio 
externo Ra (aproximação que desconsidera as raias da roda). Já a haste do péndulo é 
aproximada por uma barra de comprimento dp e altura L. 

Além disso, observe que esse sistema só apresenta rotacáo em torno de z (ambos 


os corpos) e, portanto, as velocidades angulares teráo apenas componentes em z. Desta 


forma, pode-se desconsiderar os momentos de inércia em relagao aos outros eixos, ou seja, 


0 0 O 0 0 0 
m= | $ 41, S=|6 0 5]. (C.26) 
0 0 h 0 0 Ip 


Tais valores já foram calculados e estão apresentados na Tabela C.2. 
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Tabela C.2 — Parâmetros da construção do pêndulo 


Parâmetro Valor 

Mi | Massa da haste [kg] 0,117 

Mə | Massa da roda [kg] 0,119 
L | Comprimento da haste [m] 0,14298 
1, | Momento de inércia da roda [kgm?] 9,4559 x 1074 
1, | Momento de inércia da haste [kgm?] 6, 2533 x 1074 
d | Dist. eixo-base até o centro de massa da haste [m] | 0,0987 
g | Aceleração da gravidade [m/s?] 9,81 

K, | Constante de torque do motor 0,0601 

Ke | Constante de velocidade do motor [V/(rad/s)] 0,1836 

Rm | Resistência do motor [9] 2,44 

b1,b2 | Atrito viscoso determinar 


A velocidade angular do primeiro grau de liberdade é dada por 


0 0 0 
ws =9R' lol +/0] =| 0]. (C.27) 
0 ĝi 01 


A velocidade translacional do centro de massa é 


0 0 —d6, 
Vemi = 0 + Wy x |0| = 0 a (C.28) 
0 d 0 


Para o segundo grau de liberdade, tem-se 


0 0 
ms o+ lols] O |. (C.29) 
0 0, 6, F 0, 
A velocidade de translação do centro de massa é calculada como a velocidade do 


centro do sistema de coordenadas {2}, ou seja, 
0 = cos(02) 
Vem2 = i wy x |L = Lô; sen(02) a (C.30) 
0 0 
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Com as velocidades obtidas, calculam-se as energias cinética e potencial: 


1 1 1 1 
2 (wi Tiwi) + 3 (vim Mi Vemi) + 2 (w3 Lowe) F 2 (vim MaVem2), 
| ep 
Kı K2 


K = 
(C.31) 


U = gM, dcos(6;) +9 Ma Lcos(01). (€.32) 
— or? oe Cee 


Ui U2 


Assim como no pêndulo de Furuta, o sistema possui um motor DC com tensão 
nominal de 12 V, porém, com as constantes diferentes, como pode ser visto na Tabela 


C.2. Logo, o vetor Teq é dado por 


0 —b101 


. + . ; C33) 
1% — Kb2) —bodo vane 


Atrito viscoso 


em que bı e bz devem ser estimados experimentalmente. Os demais parâmetros do sistema 
são apresentados na Tabela C.2. Por fim, as equações de movimento são encontradas 
utilizando (C.2), com q = [os A 2 

Todo o processo de modelagem é feito no código Gera Modelo Roda Reacao.m mos- 
trado a seguir. Ele retorna o modelo não linear, descrito na forma reduzida, e as matri- 
zes do modelo linearizado em torno do ponto de equilíbrio instável (pêndulo apontado 
para cima), para fins de projeto. O modelo na forma reduzida é exportado como quatro 
funções: function M Reacao.m, function V Reacao.m, function G Reacao.me func- 
tion tau eq Reacao.m, que correspondem às matrizes não lineares para a simulação do 
sistema. As matrizes do modelo linear em tempo contínuo são exportadas no arquivo 
Modelo Roda Reacao.mat. 

O diagrama de blocos do simulador é programado no Simulink® de forma semelhante 


ao que foi feito com o pêndulo de Furuta (Figura C.6). 


clear all: close all; ele; 

Parametros mecânicos 

Mi = 0.117; %Massa da haste 

M2 = 0.119; %Massa da roda 

L = 0.14298; Comprimento da haste 

Ii = 6.2533e-4; YMomento de inércia da haste 

I2 = 9.4559e-4; %Momento de inércia da roda 

d = 0.0987; /Distáncia eixo base até c.m. da haste 

bi = 0; b2 = 0; %Coefs de atrito viscoso das juntas da haste e da roda 


Parámetros do motor 
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Rm = 2.44; %Resisténcia da armadura 
Ke = 0.1836; / Cte de f.c.e.m. (já considera a redução) 
Kt = 0.0601; /Cte de torque (já considera a redução) 


hVariáveis de posição, velocidade e aceleração angulares 
syms t thi(t) th2(t) g; 

thi = thi(t); th2 = th2(t); 

thi_d = diff(th1); th2_d = diff(th2); 

thi_dd = diff(thi_d); th2_dd = diff(th2_d); 
hMatrizes de Inércia 

Ii mat = diag([0 0 I1]); 

I2 mat = diag([0 O 12]); 

%/Matrizes de rotação 

/ Haste 

Ri = [cos(th1) -sin(th1) O; sin(th1) cos(th1) 0; 0 O 1]; 
“Roda 

R2 = [cos(th2) -sin(th2) 0; sin(th2) cos(th2) 0; 0 0 1]; 
%/Cálculo das velocidades 

Haste 

wi = simplify(expand(R1.'*[0;0;0] + [0; O; thi_d])); 
vel = simplify (expand(cross(wi,[0;d;0]))); 
hRoda 

w2 = simplify(expand(R2.'*wi + [0; O; th2_d])); 
vc2 = simplify (expand(R2.'*cross(w1,[0;L;0]))); 
hhCálculo das Energias e Lagrangiana 

hEnergia Cinética do Rotação (haste + roda) 

Ecr = 1/2*w1.'*11_mat*wi + 1/2*w2.'*I2_mat*w2; 
“Energia Cinética do Translação (haste + roda) 
Ect = 1/2*vc1.'*Mi*vcl + 1/2*vc2.'*M2*vc2; 
“Energia potencial total (haste + roda) 

U = Mixg*d*cos(thi) + M2*g*L*cos(th1); 
/Lagrangiana 

Lagr = Ecr+Ect-U; 

hhEqs. de Euler-Lagrange 

“ZaL\d(thi_d) 

Lqqi = deriv(Lagr, thi_d); 

“Za (dL\d(thi_d))\dt 

Lagti = diff(Lqqi, t); 

hdLNdth1 

Lqi = deriv(Lagr, thi); 

“a(db\d(thi_d))\dt - dLidthi 

Leqi = simplify (expand(Lqqt1 - Lq1)); 
“ZaL\d(th2_d) 

Lqq2 = deriv(Lagr, th2_d); 

Za (dL \d(th2_d))\dt 

Lqgt2 = diff(Lqq2, t); 

hdLNdth2 
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Lq2 = deriv(Lagr, th2); 

“a(dL\d(th2_d))\dt = dL\dth2 

Leq2 = simplify(expand(Lqqt2 - Lq2)); 

%Como as derivadas já foram feitas, vamos substituir as variáveis 

hcom dependência temporal por variáveis que não dependem do tempo, pois o 
“problema agora consiste em resolver equações algébricas 

syms THi TH1_p TH1i pp; 

syms TH2 TH2 p TH2 pp; 


Leqi_ = subs(Leqi,th1 dd,TH1i pp); 
Leqi_ = subs(Leqi_,thi_d,TH1_p); 
Leqi_ = subs(Leqi_,thi,TH1); 

Leqi_ = subs(Leqi_,th2_dd,TH2_pp); 
Leqi_ = subs(Leqi_,th2_d,TH2_p); 
Leqi_ = subs(Leqi_,th2,TH2); 

Leq2_ = subs(Leq2,thi_dd,THi_pp) ; 
Leq2_ = subs(Leq2_,thi_d,THi_p); 
Leq2_ = subs(Leq2_,thi,TH1) ; 

Leq2_ = subs(Leq2_,th2_dd,TH2_pp); 
Leq2_ = subs(Leq2_,th2_d,TH2_p); 
Leq2_ = subs(Leq2_,th2,TH2) ; 


WhEquações de Movimento 

syms tau eq 1 tau eq 2 u; Ktau eq i são as forças generalizadas e u é um 
hsinal de -1 a 1 representando o ciclo ativo do PWM do motor e o 

/ sentido de rotação 

tau eq = [tau eq 1; tau eq 2]; 


hEqs. de Euler Lagrange reagrupadas 


si = Leqi_ - tau eq 1; 
s2 = Leq2_ - tau eq 2; 
s=[s1; s2]; 


syms q q-P 4q-PP 

q-pp=[THi pp; TH2 ppl; 

q-p=[TH1_p; TH2 pl; 

q=[TH1; TH2]; 

hModelo Reduzido 

M=simplify(expand (jacobian(s,q_pp))); %Matriz de Inércia 

G=simplify (expand(jacobian(s,g)*g)); hVetor de termos gravitacionais 
V=simplify (expand(s-M*q_pp-G+tau_eq)); %Vetor de fç centripeta-Coriolis 
G = subs(G,g,9.81); 

tau eq 2 = Kt+*(12+*u-Ke*TH2 p)/(Rm); /Equacáo do motor DC 

tau eq. 2 = tau eq 2 - b2*TH2_p; %Torque eq. na junta da roda 

tau eq. 1 = -bi*THi_p; %Torque eq. na junta do péndulo 

tau eq = subs(tau eq); 

hM, V, G e tau eq são exportados como funções 

hpara serem carregadas no modelo não linear do Simulink 
matlabFunction(M,'File','function_M_Reacao'); 


matlabFunction(V,'File','function_V_Reacao'); 
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matlabFunction(G,'File','function_G_Reacao') ; 
matlabFunction(tau_eq,'File','function_tau_eq_Reacao'); 
hEquações de Movimento 

xpp = simplify(expand(M”-1*(tau_eq-V-G))); 
hhLinearização do Modelo 

hVariáveis de estado 

x = [TH1; TH2; THi_p3 TH2 pls 

xp = [TH1_p; TH2_p; xpp(1); xpp(2)]; 
hhLinearização 

Am=jacobian(xp,x); Bm=jacobian(xp,u); 

hPonto de equilíbrio 

THi=0; TH2=0; THi_p=0; TH2_p=0; u=0; 

A = double(subs(Am)); B = double (subs (Bm)); 


save ('Modelo_Roda_Reacao.mat','A','B'); 
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